Naprednejše tehnike gručenja
Section outline
-
Od naprednih tehnik gručenja bi si želeli, da lahko odkrijejo skupine poljubnih oblik, da znajo obravnavati šumne primere in da te izključijo iz skupin, da so odvisne od čim manj parametrov in da so hitre. Ena od takih tehnik je DBSCAN, ki temelji na iskanju gostih regij primerov. Gostoto primerov sicer določata dva parametra sosednosti eps
in potrebnega števila točk veps
-soseščiniminPts
, a so na dosedanjih eksperimentih potrdili, da je DBSCAN precej odporen na spremembe parametraminPts
in da je primerno vrednost parametraeps
moč pridobiti kar iz podatkov. Prednost tega algoritma je tudi enostavna implementacija. Med naprednimi algoritmi omenimo tudi louvainsko gručenje, ki pa uporablja omrežja. Podatke za to gručenje je potrebno pretvoriti v omrežje, kjer so primeri vozlišča, povezave v omrežju tipično ustvarjene za pare najbližjih vozlišč, uteži povezav pa ustrezajo izbrani meri podobnosti med primeri.Literatura - Ester, M. in sod. (1996) A density-based algorithm for discovering clusters in large spatial databases with noise, V zborniku KDD-96, str. 226–231.
- Tan P-N in sod. (2018) Introduction to data mining, druga izdaja. Poglavje Cluster analysis: basic concepts and algorithms.
- Monti S, Tamayo P, Mesirov J, Golub T (2003) Consensus Clustering: A Resampling-Based Method for Class Discovery and Visualization of Gene Expression Microarray Data, Machine Learning 52(1-2): 91-118.