Uvrščanje v skupine ali klasifikacija predpostavlja, da je pri za vsak primer v naboru učnih primerov podan tudi razred. Cilj uvrščanja je iz učnih primerov zgraditi napovedni model, ki za nov primer in njegov opis v atributnem jeziku napove razred. Častnikarske
novice tako na primer lahko pripadajo razredu šport, poslovne novice, razvedrilo. Uporabniki telekomunikacijskih storitev so lahko zvesti ali pa po določenem času zbežijo k drugemu ponudniku (angl. churn). Spletna stran je lahko dobro
ali slabo obiskana. Izdelek v prodajalni je lahko prodajan z dobičkom ali pa izgubo.
Logistično regresijo tu izpostavljamo kot prvo med klasifikacijskimi tehnikami, predvsem zaradi podobnosti z linearno regresijo, elegantnosti izpeljave tega modela in njene izboljšave s tehniko regularizacije. Nastavek za izpeljavo
logistične regresije je logistična funkcija, ki preslika linearno kombinacijo parametrov (pomnoženih z vrednostmi vhodnih spremenljivk) v interval [0, 1]. Ko predpostavimo, da nam ta funkcija vrača verjetnosti ciljnega razreda danega primera,
lahko za nabor učnih primerov zapišemo verjetje, iz njega pa izpeljemo kriterijsko funkcijo in njen gradient. Tako, kot pri linearni regresiji, gradient uporabimo pri iskanju najprimernejših parametrov modela, to je parametrov, pri katerih
je, glede na dane učne primere, verjetje največje.
|
Literatura
Koda s predavanj
Predavanja
|