Siirry suoraan sisältöön

Datan käsittelyn kehittyneet menetelmät (5 op)

Toteutuksen tunnus: TT00CC57-3005

Toteutuksen perustiedot


Ilmoittautumisaika

30.12.2024 - 26.01.2025

Ajoitus

01.01.2025 - 31.07.2025

Opintopistemäärä

5 op

Toteutustapa

Lähiopetus

Yksikkö

Teknologia

Opetuskielet

  • Suomi

Koulutus

  • Tieto- ja viestintätekniikan koulutus

Opettaja

  • Pekka Huttunen

Ryhmät

  • TTV23SRAA
    TTV23SRAA

Tavoitteet

Kurssin tavoitteena on tutustua datan käsittelyn kehittyneisiin menetelmiin, käyttäen python-kirjastoja NumPy, Pandas, ja Matplotlib. Kurssilla käydään läpi datan ominaisuuksien (characteristic) laskemista, data-jakaumia, datana visualisointia ja säännöllisten lausekkeiden (regular expression, regex) käyttöä. Kurssilla tutustutaan myös datan klusterointiin.

Näitä menetelmiä käyttäen kurssilla luodaan datankäsittelyketju (pipeline), jolla tehdään datasta ominaisuussuunnittelua (feature engineering).

Arviointiasteikko

0 - 5

Arviointikriteerit, kiitettävä (5)

Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 5 kurssin harjoituspisteistä täytyy kertyä vähintään 92%.

Arviointikriteerit, tyydyttävä (1)

Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 1 kurssin harjoituspisteistä täytyy kertyä vähintään 50%.

Esitietovaatimukset

Python-ohjelmointi, Nykyaikainen ohjelmistokehitys, Algebra