Vizuális kategóriák tanulása

 
Vizuális kategóriák tanulása
2008. okt. 1. – 2011. szep. 30.
Külső azonosító
OTKA 76414
Költségvetés
13.1 MFt
 

A jelenlegi kutatás elsődleges célja vizuális információt reprezentáló modellek
kidolgozása integrálva a képi objektumok strukturális, megjelenési és mozgási jellemzőit.
Véleményünk szerint ezen jellemzők integrálásával jelentősen javítható a jelenlegi képi
kategerizáló és felismerő algoritmusok hatékonysága.
Az ember látórendszerének talán a leghasznosabb tulajdonsága az objektumok felismerésének
és klasszifikációjának képessége. Egy pillantás alatt képesek vagyunk felmérni az
objektumok szinte összes vizuális jellemzőjét. Képesek vagyunk különbséget tenni
kategóriák között (pl. autók és emberek) és a kategóriák egyes elemei között (pl. a
testvérünk arcát az apánk arcától) is. Ezzel ellentétben, a jelenlegi számítógépes
rendszerek teljesítménye nagyon messze vannak az emberekétől a megtanulható kategóriák
számát, a feldolgozás sebességét valamint az új kategóriák tanulásának egyszerűségét
illetően.
Az emberi felismerési képességek számítógépek általi másolása alapjaiban változtathatja
meg a mindennapi életünket. A lehetséges alkalmazások sora szinte végtelen; kezdve az
egészségügyi alkalmazásoktól, a robotikán, az autonóm járművek fejlesztésén át a
különböző biztonságtechnikai alkalmazásokig stb.
A kutatásunk során az objektumok megjelenésének és struktúrájának egy- és több-nézeti
modellezésével, különböző vizuális jellemzők egységes modellbe való integrálásával,
statisztikai tanulóalgoritmusok alkalmazásával valamint objektumok és események
kategorizálásával kívánunk foglalkozni.

Résztvevők

MTA SZTAKI

Részleg