Siirry suoraan sisältöön

Datan käsittelyn kehittyneet menetelmät (5 op)

Toteutuksen tunnus: TT00CC57-3002

Toteutuksen perustiedot


Ilmoittautumisaika

02.12.2022 - 31.01.2023

Ajoitus

01.01.2023 - 12.04.2023

Opintopistemäärä

5 op

Toteutustapa

Lähiopetus

Yksikkö

Teknologia

Opetuskielet

  • Suomi

Koulutus

  • Tieto- ja viestintätekniikan koulutus

Opettaja

  • Pekka Huttunen

Ryhmät

  • TTM22SAI
    TTM22SAI

Tavoitteet

Kurssin tavoitteena on tutustua datan käsittelyn kehittyneisiin menetelmiin, käyttäen python-kirjastoja NumPy, Pandas, ja Matplotlib. Kurssilla käydään läpi datan ominaisuuksien (characteristic) laskemista, data-jakaumia, datana visualisointia ja säännöllisten lausekkeiden (regular expression, regex) käyttöä. Kurssilla tutustutaan myös datan klusterointiin.

Näitä menetelmiä käyttäen kurssilla luodaan datankäsittelyketju (pipeline), jolla tehdään datasta ominaisuussuunnittelua (feature engineering).

Arviointiasteikko

0 - 5

Arviointikriteerit, kiitettävä (5)

Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 5 kurssin harjoituspisteistä täytyy kertyä vähintään 92%.

Arviointikriteerit, tyydyttävä (1)

Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 1 kurssin harjoituspisteistä täytyy kertyä vähintään 50%.

Esitietovaatimukset

Python-ohjelmointi, Nykyaikainen ohjelmistokehitys, Algebra