1. projekt: vizualizacija novic rtvslo.si
Iz podatkov z več deset tisoč novicami na spletne strani rtvslo.si morate ustvariti točkovni diagram, na katerem smiselno označite skupine ter jih razložite, kot denimo prikazuje spodnja skica.
Glede metodologije vam namenoma puščamo veliko svobode, skoraj gotovo boste pa morali članke pretvoriti v tabelarično obliko ter uporabiti metode gručenja in/ali projekcij v nižjedimenzionalne prostore. Cel postopek (vključno z razlago) mora biti avtomatiziran.
Podrobnosti vizualizacije določite sami. Vizualizacije so lahko tudi interaktivne; če so, pazite, da že brez interakcije podajajo dovolj zanimivih informacij.
Ocenjevanje:
[20%] Kako iz podatkov pridete do pozicij točk; metodologija in utemeljitev.
[20%] Kako iz podatkov pridete do skupin; metodologija in utemeljitev.
[20%] Razlaga skupin; metodologija in utemeljitev.
[30%] Vizualizacija. Ocenjujemo preglednost, količino podanih informacij in umetniški vtis.
[10%] Pregledanost oddane programske kode ter enostavnost (in opis) zagona.
Knjižnice. Pri nalogi lahko uporabite poljubne knjižnice, ki pa morajo biti javno dostopne, da nalogo lahko preizkusimo. Če uporabljate preko API-jev dostopne servise, naj vaša koda vsebuje tudi ustrezen "token".
Repozitorij za oddajo. Program s pomožnimi datotekami oddajte v Github repozitorij, ki se ustvari na tej povezavi.
Oblika rešitve. Vaš program v glavni datoteki main.py
naj pri zagonu z python main.py
ustvari zahtevano vizualizacijo člankov iz articles.yaml
, za katero predpostavlja, da se nahaja v istem direktoriju. Navodila za zagon programa, ki vključujejo zahtevana knjižnice, napišite v README.md
. Če poganjanje traja več kot nekaj minut, ustvarite (in oddajte) tudi potrebne vmesne rezultate, da se zagon skrajša; če jih, morate oddati tudi kodo, s katerimi ste vmesne rezultate ustvarili (ter to opišite v README.md
). Ustvarite lahko tudi poljubne pomožne datoteke. Vhodne datoteke s članki ne shranjujte v repozitorij (dodal smo jo v .gitignore
). Repozitorij lahko vsebuje poljubne pomožne datoteke ali pomožne iPython zvezke s predstavitvijo vaše metodologije, le končna rešitev mora v celoti deluje pri zagonu main.py
. Program naj bo kompatibilen s Pythonom 3.12.
Predstavitev. Oddajte tudi 5-minutni predstavitvi namenjeno projekcijo, ki jo izvozite kot PDF. Obsega naj do 4 prosojnice z razlago in argumentacijo metodologije, do 2 prosojnici z vizualizacijo, ter do 2 prosojnici s poljubnim komentarjem.
Oddaja. Kodo oddajte v repozitorij na GitHubu. Na spletno učilnico oddajte vašo predstavitev (.pdf). Vključite jo tudi v repozitorij s kodo.
Datoteka s članki: articles.yaml.zip