1. Uvod v vizualno programiranje in razvoj shem za podatkovno analitiko. Branje podatkov, vizualizacija, izbor. Razsevni diagrami, izbor projekcije podatkov.
2. Klasifikacija. Klasifikacijska drevesa. Ocenjevanje napovedne točnosti (klasifikacijska točnost, AUC). Pregled ostalih metod, vključno z logistično regresijo, SVM in naključnimi gozdovi. Statistična primerjava klasifikacijskih metod.
3. Regresija. Metoda linearne in polinomske regresije. Vpliv regularizacije na uspešnost napovedi na učni in testni množici. Določanje parametrov učnih algoritmov.
4. Razvrščanje v skupine. Tehnika hierarhičnega razvrščanja v skupine, metoda voditeljev in metoda DBSCAN. Računske in prostorske kompleksnosti posameznih metod.
5. Projekcije podatkov. Metoda glavnih komponent, večrazredno lestvičenje in metoda TSNE.
6. Analiza nestrukturiranih podatkovnih virov, kot so slike in zaporedja. Vložitev objektov v vektorskih prostor. Globoki modeli.1.
- nosilec: Blaž Zupan