Datan käsittelyn kehittyneet menetelmät (5 op)
Toteutuksen tunnus: TT00CC57-3006
Toteutuksen perustiedot
- Ilmoittautumisaika
-
02.12.2025 - 31.12.2025
Ilmoittautuminen toteutukselle ei ole vielä alkanut.
- Ajoitus
-
01.01.2026 - 31.07.2026
Toteutus ei ole vielä alkanut.
- Opintopistemäärä
- 5 op
- Lähiosuus
- 5 op
- Toteutustapa
- Monimuoto-opetus
- Yksikkö
- Teknologia
- Opetuskielet
- suomi
- Koulutus
- Tieto- ja viestintätekniikan koulutus
- Opettajat
- OPE_Tieto_ja_viestintätekniikka OPE_Tieto_ja_viestintätekniikka
- Ryhmät
-
TTM25SAITTM25SAI
- Opintojakso
- TT00CC57
Arviointiasteikko
0 - 5
Tavoitteet
Kurssin tavoitteena on tutustua datan käsittelyn kehittyneisiin menetelmiin, käyttäen python-kirjastoja NumPy, Pandas, ja Matplotlib. Kurssilla käydään läpi datan ominaisuuksien (characteristic) laskemista, data-jakaumia, datana visualisointia ja säännöllisten lausekkeiden (regular expression, regex) käyttöä. Kurssilla tutustutaan myös datan klusterointiin.
Näitä menetelmiä käyttäen kurssilla luodaan datankäsittelyketju (pipeline), jolla tehdään datasta ominaisuussuunnittelua (feature engineering).
Arviointikriteerit, tyydyttävä (1)
Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 1 kurssin harjoituspisteistä täytyy kertyä vähintään 50%.
Arviointikriteerit, kiitettävä (5)
Kurssi muodostuu useista harjoitustehtävistä. Arvosanaan 5 kurssin harjoituspisteistä täytyy kertyä vähintään 92%.
Esitietovaatimukset
Python-ohjelmointi, Nykyaikainen ohjelmistokehitys, Algebra