Datan käsittelyn kehittyneet menetelmät (5op)
Toteutuksen tunnus: TT00CC57-3003
Toteutuksen perustiedot
- Ilmoittautumisaika
- 01.12.2023 - 31.01.2024
- Ilmoittautuminen toteutukselle on päättynyt.
- Ajoitus
- 01.01.2024 - 08.04.2024
- Toteutus on päättynyt.
- Opintopistemäärä
- 5 op
- Lähiosuus
- 5 op
- Toteutustapa
- Lähiopetus
- Yksikkö
- Teknologia
- Opetuskielet
- suomi
- Koulutus
- Tieto- ja viestintätekniikan koulutus
Toteutukselle Datan käsittelyn kehittyneet menetelmät TT00CC57-3003 ei valitettavasti löytynyt varauksia. Varauksia ei ole mahdollisesti vielä julkaistu tai toteutus on itsenäisesti suoritettava.
Arviointiasteikko
0 - 5
Tavoitteet
Kurssin tavoitteena on tutustua datan käsittelyn kehittyneisiin menetelmiin, käyttäen python-kirjastoja NumPy, Pandas, ja Matplotlib. Kurssilla käydään läpi datan ominaisuuksien (characteristic) laskemista, data-jakaumia, datana visualisointia ja säännöllisten lausekkeiden (regular expression, regex) käyttöä. Kurssilla tutustutaan myös datan klusterointiin.
Näitä menetelmiä käyttäen kurssilla luodaan datankäsittelyketju (pipeline), jolla tehdään datasta ominaisuussuunnittelua (feature engineering).
Arviointikriteerit, tyydyttävä (1)
Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 1 kurssin harjoituspisteistä täytyy kertyä vähintään 50%.
Arviointikriteerit, kiitettävä (5)
Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 5 kurssin harjoituspisteistä täytyy kertyä vähintään 92%.
Esitietovaatimukset
Python-ohjelmointi, Nykyaikainen ohjelmistokehitys, Algebra