Költséghatékony osztályozás:

a félig felügyelt gépi tanuló algoritmusok

BODÓ ZALÁN, Matematika és Informatika Kar, BBTE

A Magyar Tudomány Napja Erdélyben, 2016 nov. 25-26.

Gépi tanulás: felügyelt módszerek

tanulási példák

betanult modell

Példa: kutyák vs macskák

(     ,kutya)

(       ,kutya)

(       ,macska)

(       ,macska)

\hat{f}(x)
f^(x)\hat{f}(x)
x
xx
y
yy

adatok

címkék

?

Osztályozási feladatok - példák

Levélszemét kiszűrése

Optikai karakterfelismerés (OCR) / digitalizálás

Kézírás-felismerés

Egy egyszerű osztályozási módszer: kNN

  • k legközelebbi szomszéd meghatározása
  • többségi címke hozzárendelése

Félig felügyelt tanulás

= címkézett adatok + címkézetlen adatok

1. osztály

2. osztály

?

2. osztály

Címkepropagálás

  • ötlet: propagáljuk a címkéket a címkézett pontoktól (adatoktól) a címkézetlen pontok felé a pontok hasonlóságának függvényében
  • azaz, minél hasonlóbbak (közelibbek) egymáshoz, annál nagyobb valószínűséggel

(Zhu & Ghahramani, 2002)

Y = T\cdot Y
Y=TYY = T\cdot Y

Matematikailag:

(

)

Pszichológia:

Gráfelmélet:

(Collins & Loftus, 1975)

terjedő aktiváció

gráfok véletlen bejárása

(spreading activation)

P(x ponthoz a c címkét rendeljük) =

annak a valószínűsége, hogy az x-ből kiinduló véletlen bejárás során

az első címkézett pont c címkével lesz ellátva

"Humans Perform

Semi-Supervised Classification Too"

(Zhu et al., 2007)

  • Wisconsin Egyetem, 2007
  • 22 alany
  • bináris osztályozás: 2 fiktív virág (Belianthus és Nortulaca) pollenszemcséinek mikroszkóp alatti képe

Példa: 7 vs 9

Köszönöm a figyelmet!

Kérdések?

Költséghatékony osztályozás

By Zalan Bodo

Költséghatékony osztályozás

  • 469