Datan käsittelyn kehittyneet menetelmät (5 op)
Toteutuksen tunnus: TT00CC57-3003
Toteutuksen perustiedot
Ilmoittautumisaika
01.12.2023 - 31.01.2024
Ajoitus
01.01.2024 - 08.04.2024
Opintopistemäärä
5 op
Toteutustapa
Lähiopetus
Yksikkö
Teknologia
Opetuskielet
- Suomi
Koulutus
- Tieto- ja viestintätekniikan koulutus
Opettaja
- Pekka Huttunen
Ryhmät
-
TTM23SAITTM23SAI
- 08.01.2024 17:00 - 19:00, Datan käsittelyn kehittyneet menetelmät TT00CC57-3003
- 22.01.2024 17:00 - 18:00, Datan käsittelyn kehittyneet menetelmät TT00CC57-3003
- 05.02.2024 17:00 - 18:00, Datan käsittelyn kehittyneet menetelmät TT00CC57-3003
- 19.02.2024 17:00 - 18:00, Datan käsittelyn kehittyneet menetelmät TT00CC57-3003
- 11.03.2024 17:00 - 18:00, Datan käsittelyn kehittyneet menetelmät TT00CC57-3003
Tavoitteet
Kurssin tavoitteena on tutustua datan käsittelyn kehittyneisiin menetelmiin, käyttäen python-kirjastoja NumPy, Pandas, ja Matplotlib. Kurssilla käydään läpi datan ominaisuuksien (characteristic) laskemista, data-jakaumia, datana visualisointia ja säännöllisten lausekkeiden (regular expression, regex) käyttöä. Kurssilla tutustutaan myös datan klusterointiin.
Näitä menetelmiä käyttäen kurssilla luodaan datankäsittelyketju (pipeline), jolla tehdään datasta ominaisuussuunnittelua (feature engineering).
Arviointiasteikko
0 - 5
Arviointikriteerit, kiitettävä (5)
Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 5 kurssin harjoituspisteistä täytyy kertyä vähintään 92%.
Arviointikriteerit, tyydyttävä (1)
Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 1 kurssin harjoituspisteistä täytyy kertyä vähintään 50%.
Esitietovaatimukset
Python-ohjelmointi, Nykyaikainen ohjelmistokehitys, Algebra