Odkrivanje skupin
Section outline
-
Odkrivanje skupin je eden od temeljnih postopkov, ki jih uporabljamo pri analizi podatkov. Odkrivamo lahko skupine uporabnikov glede na njihove uporabniške profile (uporaba storitev, nakupovalne košarice, vzorci obnašanja, stiki v družabnih omrežij), stvari (profili zanimanja uporabnikov, semantične podobnosti), dokumentov (glede na besedilo, ključne besede, zanimanje in ocene uporabnikov). Med številnimi algoritmi, ki se danes uporabljajo za odkrivanje skupin v podatkih, je prav gotovo najbolj znan algoritem hierarhičnega razvrščanja v skupine. Najbrž zaradi njegovi enostavnosti in pa zaradi tega, ker je njegove rezultate moč enostavno grafično predstaviti. Prav je, da s tem algoritmom pričnemo predmet. Literatura
Video predstavitve izbranih tem
Dodatni viri- Tan P-N, Steinbach M in Kumar V (2006) Introduction to Data Mining, osmo poglavje ( Cluster Analysis: Basic Concepts and Algorithms)
- Segaran T (2007) Programming Collective Intelligence, tretje poglavje (Discovering groups)
- Ester M, Kriegel H-P, Sander J, Xu X (1996). A density-based algorithm for discovering clusters in large spatial databases with noise. Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96). AAAI Press. pp. 226–231.
Podatki in koda- Učni množici podatkov (učenci in ocene pri predmetih): grades-two.csv in grades.csv
- Hierarhično razvrščanje v skupine