Siirry suoraan sisältöön

Datan käsittelyn kehittyneet menetelmät (5 op)

Toteutuksen tunnus: TT00CC57-3003

Toteutuksen perustiedot


Ilmoittautumisaika

01.12.2023 - 31.01.2024

Ajoitus

01.01.2024 - 08.04.2024

Opintopistemäärä

5 op

Toteutustapa

Lähiopetus

Yksikkö

Teknologia

Opetuskielet

  • Suomi

Koulutus

  • Tieto- ja viestintätekniikan koulutus

Opettaja

  • Pekka Huttunen

Ryhmät

  • TTM23SAI
    TTM23SAI
  • 08.01.2024 17:00 - 19:00, Datan käsittelyn kehittyneet menetelmät TT00CC57-3003
  • 22.01.2024 17:00 - 18:00, Datan käsittelyn kehittyneet menetelmät TT00CC57-3003
  • 05.02.2024 17:00 - 18:00, Datan käsittelyn kehittyneet menetelmät TT00CC57-3003
  • 19.02.2024 17:00 - 18:00, Datan käsittelyn kehittyneet menetelmät TT00CC57-3003
  • 11.03.2024 17:00 - 18:00, Datan käsittelyn kehittyneet menetelmät TT00CC57-3003

Tavoitteet

Kurssin tavoitteena on tutustua datan käsittelyn kehittyneisiin menetelmiin, käyttäen python-kirjastoja NumPy, Pandas, ja Matplotlib. Kurssilla käydään läpi datan ominaisuuksien (characteristic) laskemista, data-jakaumia, datana visualisointia ja säännöllisten lausekkeiden (regular expression, regex) käyttöä. Kurssilla tutustutaan myös datan klusterointiin.

Näitä menetelmiä käyttäen kurssilla luodaan datankäsittelyketju (pipeline), jolla tehdään datasta ominaisuussuunnittelua (feature engineering).

Arviointiasteikko

0 - 5

Arviointikriteerit, kiitettävä (5)

Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 5 kurssin harjoituspisteistä täytyy kertyä vähintään 92%.

Arviointikriteerit, tyydyttävä (1)

Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 1 kurssin harjoituspisteistä täytyy kertyä vähintään 50%.

Esitietovaatimukset

Python-ohjelmointi, Nykyaikainen ohjelmistokehitys, Algebra