Datan käsittelyn kehittyneet menetelmät (5 op)
Toteutuksen tunnus: TT00CC57-3003
Toteutuksen perustiedot
- Ilmoittautumisaika
-
01.12.2023 - 31.01.2024
Ilmoittautuminen toteutukselle on päättynyt.
- Ajoitus
-
01.01.2024 - 08.04.2024
Toteutus on päättynyt.
- Opintopistemäärä
- 5 op
- Lähiosuus
- 5 op
- Toteutustapa
- Lähiopetus
- Yksikkö
- Teknologia
- Opetuskielet
- suomi
- Koulutus
- Tieto- ja viestintätekniikan koulutus
Arviointiasteikko
0 - 5
Tavoitteet
Kurssin tavoitteena on tutustua datan käsittelyn kehittyneisiin menetelmiin, käyttäen python-kirjastoja NumPy, Pandas, ja Matplotlib. Kurssilla käydään läpi datan ominaisuuksien (characteristic) laskemista, data-jakaumia, datana visualisointia ja säännöllisten lausekkeiden (regular expression, regex) käyttöä. Kurssilla tutustutaan myös datan klusterointiin.
Näitä menetelmiä käyttäen kurssilla luodaan datankäsittelyketju (pipeline), jolla tehdään datasta ominaisuussuunnittelua (feature engineering).
Arviointikriteerit, tyydyttävä (1)
Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 1 kurssin harjoituspisteistä täytyy kertyä vähintään 50%.
Arviointikriteerit, kiitettävä (5)
Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 5 kurssin harjoituspisteistä täytyy kertyä vähintään 92%.
Esitietovaatimukset
Python-ohjelmointi, Nykyaikainen ohjelmistokehitys, Algebra