Költséghatékony osztályozás:
a félig felügyelt gépi tanuló algoritmusok
BODÓ ZALÁN, Matematika és Informatika Kar, BBTE
A Magyar Tudomány Napja Erdélyben, 2016 nov. 25-26.
Gépi tanulás: felügyelt módszerek
tanulási példák
betanult modell
Példa: kutyák vs macskák
( ,kutya)
( ,kutya)
( ,macska)
( ,macska)
\hat{f}(x)
f^(x)
x
x
y
y
adatok
címkék
?
Osztályozási feladatok - példák
Levélszemét kiszűrése
Optikai karakterfelismerés (OCR) / digitalizálás
Kézírás-felismerés
Egy egyszerű osztályozási módszer: kNN
- k legközelebbi szomszéd meghatározása
- többségi címke hozzárendelése
Félig felügyelt tanulás
= címkézett adatok + címkézetlen adatok
1. osztály
2. osztály
?
2. osztály
Címkepropagálás
- ötlet: propagáljuk a címkéket a címkézett pontoktól (adatoktól) a címkézetlen pontok felé a pontok hasonlóságának függvényében
- azaz, minél hasonlóbbak (közelibbek) egymáshoz, annál nagyobb valószínűséggel
(Zhu & Ghahramani, 2002)
Y = T\cdot Y
Y=T⋅Y
Matematikailag:
(
)
Pszichológia:
Gráfelmélet:
(Collins & Loftus, 1975)
terjedő aktiváció
gráfok véletlen bejárása
(spreading activation)
P(x ponthoz a c címkét rendeljük) =
annak a valószínűsége, hogy az x-ből kiinduló véletlen bejárás során
az első címkézett pont c címkével lesz ellátva
"Humans Perform
Semi-Supervised Classification Too"
(Zhu et al., 2007)
- Wisconsin Egyetem, 2007
- 22 alany
- bináris osztályozás: 2 fiktív virág (Belianthus és Nortulaca) pollenszemcséinek mikroszkóp alatti képe
Példa: 7 vs 9
Köszönöm a figyelmet!
Kérdések?
Költséghatékony osztályozás
By Zalan Bodo
Költséghatékony osztályozás
- 471