1. domača naloga: glasovanje za pesem Evrovizije
Tisti, ki spremljajo glasovanje za Pesem Evrovizije, pravijo, da ni najbolj objektivno. Predstavniki posameznih držav glasujejo pristransko in favorizirajo nastopajoče iz sorodnih držav. Tako očitno je, da so take vzorce priznali celo organizatorji: v letu 2022 so nekatere države goljufale, zato so njihove glasove zamenjali s podobnimi državami.
Pa preverimo, če res drži! Analizirali bomo pretekla glasovanja. V priloženi datoteki (.xlsx) imamo na voljo podatke glasovanj preteklih tekmovanj. Primerjaj države med sabo tako, da oceniš razdaljo med njimi glede na to, kako glasujejo: glede na njihov profil glasovanja. Pri tem uporabi že razvit postopek za hierarhično razvrščanje v skupine. Za reševanje naloge uporabi zgolj podatke s finalov.
V nalogi boš moral(a) ustrezno rešiti kar nekaj problemov. Na primer, kako zapisati podatke v primerni obliki? Kako združiti podatke iz posameznih let in se pri tem izogniti nepotrebnim povprečjim? Je smiselno obravnavati vse podatke ali jih prefiltriramo? Je res smiselno analizirati vse podatke ali se lahko, ob spreminjajoči se geopolitični situaciji, omejimo na podatke zadnjih nekaj let?
Za oddajo pripravite predstavitvi namenjeno projekcijo, ki jo izvozite kot pdf. Obsega naj le 5 (+1) prosojnic:
- [20%] Podatki. Katere podatke ste analizirali? Kako ste iz podatkov izluščili profile glasovanja? Kako ste ustvarili profil glasovanja posameznih držav? Ste podatke kako obdelali (recimo glede neznanih vrednosti)?
- [20%] Parametri razvrščanja. Kako ste računali razdalje med posameznimi profili ter med posameznimi skupinami? Zakaj ste se odločili za izbrane parametre?
- [20%] Grafični dendrogram (lahko ga implementirate sami ali uporabite iz kake knjižnice; v vsakem primeru morate uporabite rezultate vašega razvrščanja) in smiselno prikazan graf silhuete glede na število skupin. Na dendrogramu označite skupine.
- [20%] Argumentiraj odločitev za izbrane (in prej prikazane) skupine.
- [20%] Razlaga zanimivih skupin. Geopolitični vidiki in analiza glasovanja skupin. Poleg analize na kratko opišite postopek, ki privede do rezultatov glede preferiranih in nepreferiranih držav.
Na poljubno mesto lahko dodate še eno prosojnico s poljubno vsebino.
Oddaja. Na spletno učilnico oddajte vašo predstavitev (.pdf) in kodo (eno .py datoteko). Del rešitve je tudi vaša programska koda, zato naj bo pregledna. Vaša koda naj deluje s podano nespremenjeno (.xlsx) datoteko in naj direktno generira vse uporabljene rezultate. Vso obdelavo morate torej narediti v Pythonu.
Datoteka s podatki (s portala data.world, uporabnik datagraver)
- 10. marec 2024, 12:14