Gépi Tanulás KutatócsoportVezető- Szepesvári Csaba
Részleg adatai
Tevékenység
A csoport 2004 januárban alakult gépi tanuló algoritmusok kutatásának es ezek fejlett ember-gép interfészekben való alkalmazásának céljával.
Főbb témák:
- megerősítéses tanulás (RL)
- függvény aproximáció és RL
- algoritmusok és elmélet
- részlegesen megfigyelhető MDP-k
- portfolió optimalizálás
- játékok
- több-szereplős játékok
- sztohasztikus játékok (pl. póker)
- kapcsolódó alkalmazások (pl. bidding)
- természetes nyelv feldolgozás
- önszervező tanulás
- intelligens információ visszakeresés alkalmazások
- beszéd és hang feldolgozás
- beszéd felismerés - dialógus rendszerek, jó minőségű, kis méretű szintézis (pl. PDA-hoz)
- idegen-nyelv tanítás
- CASA - számítógépes akkusztikus környezet-elemzés
- gépi tanulás griden
- gépi tanulás alkalmazása gépi látásban
- aláírás ellenőrzés
- robusztus karakter felismerés (pl. zajos, elrontott vagy kitakart karakterek felismerése)
További információk
Munkatársak- Antos András

- György András
 Cím: 1111 Budapest, Kende u. 13-17.Szoba: K 303Telefon: +36 1 279-6262Fax: +36 1 466-7503E-mail: andras.gyorgyEZT_TOROLJE_KI@EZT_TOROLJE_KIsztaki.huHonlap: www.szit.bme.hu/~gya
- Kocsis Levente
- Neu Gergely
2010.- Models of active learning in group-structured state spaces
- A General Projection Property for Distribution Families
Szerzők: Yu, Yaoliang; Li, Yuxi; Szepesvári, Csaba; Schuurmans, DaleMegjelenés: 2010.
- Convergent Temporal-Difference Learning with Arbitrary Differentiable Function Approximator
Szerzők: Maei, Hamid Reza; Szepesvári, Csaba; Bhathnagar, Shalabh; Silver, David; Precup, Doina; Sutton, RichardMegjelenés: 2010.
2009.- Exploration-exploitation tradeoff using variance estimates in multi-armed bandits.
- Training parsers by inverse reinforcement learning.

2008.- Speeding up planning in Markov decision processes via automatically constructed abstractions.
Szerzők: Isaza, Alejandro; Szepesvári, Csaba; Bulitko, Vadim; Greiner, RusselSzerkesztő: McAllester, David A.; Myllymäki, PetriMegjelenés: 2008.Link a cikkre: [pdf]
- Tracking the best quantizer.
- Active learning in multi-armed bandits.
 Szerzők: Antos, András; Grover, Varun; Szepesvári, CsabaSzerkesztő: Freund, Yoav; Györfi, László; Turán, György; Zuegmann, ThomasMegjelenés: 2008.Link a cikkre: [ps.gz], [pdf], [pdf], [pdf]
- Dyna-style planning with linear function approximation and prioritized sweeping.
Szerzők: Sutton, Richard S.; Szepesvári, Csaba; Geramifard, Alborz; Bowling, Michael H.Szerkesztő: McAllester, David A.; Myllymäki, PetriMegjelenés: 2008.Link a cikkre: [pdf]
- Empirical Bernstein stopping.
Szerzők: Mnih, Volodymyr; Szepesvári, Csaba; Audibert, Jean-YvesMegjelenés: 2008.Link a cikkre: [pdf]
- Active learning of group-structured environments.
- Regularized fitted Q-iteration: application to planning.
Szerzők: Farahmand, Amir massoud; Ghavamzadeh, Mohammad; Szepesvári, Csaba; Mannor, ShieMegjelenés: 2008.Link a cikkre: [pdf]
- Finite-time bounds for fitted value iteration.
|