Siirry suoraan sisältöön

Datan käsittelyn kehittyneet menetelmät (5 op)

Toteutuksen tunnus: TT00CC57-3004

Toteutuksen perustiedot


Ilmoittautumisaika

30.12.2024 - 26.01.2025

Ajoitus

01.01.2025 - 31.07.2025

Opintopistemäärä

5 op

Toteutustapa

Lähiopetus

Yksikkö

Teknologia

Opetuskielet

  • Suomi

Koulutus

  • Tieto- ja viestintätekniikan koulutus

Opettaja

  • Pekka Huttunen

Ryhmät

  • TTM24SAI
    TTM24SAI
  • 09.01.2025 17:00 - 19:00, Aloitusluento_Datan käsittelyn kehittyneet menetelmät TT00CC57-3004
  • 16.01.2025 17:00 - 18:00, Q&A_Datan käsittelyn kehittyneet menetelmät TT00CC57-3004
  • 23.01.2025 17:00 - 18:00, Q&A Datan käsittelyn kehittyneet menetelmät TT00CC57-3004
  • 30.01.2025 17:00 - 18:00, Q&A Datan käsittelyn kehittyneet menetelmät TT00CC57-3004
  • 13.02.2025 17:00 - 18:00, Q&A Datan käsittelyn kehittyneet menetelmät TT00CC57-3004
  • 27.02.2025 17:00 - 18:00, Q&A Datan käsittelyn kehittyneet menetelmät TT00CC57-3004
  • 13.03.2025 17:00 - 19:00, Q&A_Datan käsittelyn kehittyneet menetelmät TT00CC57-3004

Tavoitteet

Kurssin tavoitteena on tutustua datan käsittelyn kehittyneisiin menetelmiin, käyttäen python-kirjastoja NumPy, Pandas, ja Matplotlib. Kurssilla käydään läpi datan ominaisuuksien (characteristic) laskemista, data-jakaumia, datana visualisointia ja säännöllisten lausekkeiden (regular expression, regex) käyttöä. Kurssilla tutustutaan myös datan klusterointiin.

Näitä menetelmiä käyttäen kurssilla luodaan datankäsittelyketju (pipeline), jolla tehdään datasta ominaisuussuunnittelua (feature engineering).

Arviointiasteikko

0 - 5

Arviointikriteerit, kiitettävä (5)

Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 5 kurssin harjoituspisteistä täytyy kertyä vähintään 92%.

Arviointikriteerit, tyydyttävä (1)

Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 1 kurssin harjoituspisteistä täytyy kertyä vähintään 50%.

Esitietovaatimukset

Python-ohjelmointi, Nykyaikainen ohjelmistokehitys, Algebra