Naprednejše tehnike gručenja
Section outline
-
Od naprednih tehnik gručenja bi si želeli, da lahko odkrijejo skupine poljubnih oblik, da znajo obravnavati šumne primere in da te izključijo iz skupin, da so odvisne od čim manj parametrov in da so hitre. Ena od takih tehnik je DBSCAN, ki temelji na iskanju gostih regij primerov. Gostoto primerov sicer določata dva parametra sosednosti epsin potrebnega števila točk veps-soseščiniminPts, a so na dosedanjih eksperimentih potrdili, da je DBSCAN precej odporen na spremembe parametraminPtsin da je primerno vrednost parametraepsmoč pridobiti kar iz podatkov. Prednost tega algoritma je tudi enostavna implementacija. Med naprednimi algoritmi omenimo tudi louvainsko gručenje, ki pa uporablja omrežja. Podatke za to gručenje je potrebno pretvoriti v omrežje, kjer so primeri vozlišča, povezave v omrežju tipično ustvarjene za pare najbližjih vozlišč, uteži povezav pa ustrezajo izbrani meri podobnosti med primeri.Literatura - Ester, M. in sod. (1996) A density-based algorithm for discovering clusters in large spatial databases with noise, V zborniku KDD-96, str. 226–231.
- Tan P-N in sod. (2018) Introduction to data mining, druga izdaja. Poglavje Cluster analysis: basic concepts and algorithms.
- Monti S, Tamayo P, Mesirov J, Golub T (2003) Consensus Clustering: A Resampling-Based Method for Class Discovery and Visualization of Gene Expression Microarray Data, Machine Learning 52(1-2): 91-118.