Datan käsittelyn kehittyneet menetelmät (5 op)
Toteutuksen tunnus: TT00CC57-3002
Toteutuksen perustiedot
- Ilmoittautumisaika
-
02.12.2022 - 31.01.2023
Ilmoittautuminen toteutukselle on päättynyt.
- Ajoitus
-
01.01.2023 - 12.04.2023
Toteutus on päättynyt.
- Opintopistemäärä
- 5 op
- Lähiosuus
- 5 op
- Toteutustapa
- Lähiopetus
- Yksikkö
- Teknologia
- Opetuskielet
- suomi
- Koulutus
- Tieto- ja viestintätekniikan koulutus
Arviointiasteikko
0 - 5
Tavoitteet
Kurssin tavoitteena on tutustua datan käsittelyn kehittyneisiin menetelmiin, käyttäen python-kirjastoja NumPy, Pandas, ja Matplotlib. Kurssilla käydään läpi datan ominaisuuksien (characteristic) laskemista, data-jakaumia, datana visualisointia ja säännöllisten lausekkeiden (regular expression, regex) käyttöä. Kurssilla tutustutaan myös datan klusterointiin.
Näitä menetelmiä käyttäen kurssilla luodaan datankäsittelyketju (pipeline), jolla tehdään datasta ominaisuussuunnittelua (feature engineering).
Arviointikriteerit, tyydyttävä (1)
Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 1 kurssin harjoituspisteistä täytyy kertyä vähintään 50%.
Arviointikriteerit, kiitettävä (5)
Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 5 kurssin harjoituspisteistä täytyy kertyä vähintään 92%.
Esitietovaatimukset
Python-ohjelmointi, Nykyaikainen ohjelmistokehitys, Algebra