- Szepesvári Csaba
Publikációk[ Időrendben]
[ Kategóriákba sorolva ]
[ Szerzőnként]
2010.- Convergent Temporal-Difference Learning with Arbitrary Differentiable Function Approximator
Szerzők: Maei, Hamid Reza; Szepesvári, Csaba; Bhathnagar, Shalabh; Silver, David; Precup, Doina; Sutton, RichardMegjelenés: 2010.Megjelent: Neural Information Processing Systems (NIPS-22) (Terjedelem: 9 oldal)
- A General Projection Property for Distribution Families
Szerzők: Yu, Yaoliang; Li, Yuxi; Szepesvári, Csaba; Schuurmans, DaleMegjelenés: 2010.Megjelent: Neural Information Processing Systems (NIPS-22) (Terjedelem: 9 oldal)
- Models of active learning in group-structured state spaces.
Szerzők: Bartók, Gábor; Szepesvári, Csaba; Zilles, S.Megjelenés: 2010.Megjelent: Information and Computation (Kötetszám: 208, Oldalszám: 364-384.)
- Active learning in heteroscedastic noise.

- The online loop-free stochastic shortest-path problem.
- Error propagation for approximate policy and value iteration.
Szerzők: Farahmand, A. M.; Munos, R.; Szepesvári, CsabaMegjelenés: 2010.Megjelent: NIPS 2010. Twenty-fourth annual conference on neural information processing systems. Proceedings. Vancouver, 2010. (Terjedelem: 1-9. oldal)Link a cikkre: [pdf]
- Model-based reinforcement learning with nearly tight exploration complexity bounds.
Szerzők: Szita, I.; Szepesvári, CsabaMegjelenés: 2010.Megjelent: ICML 2010. Proceedings of the 27th international conference on machine learning. Haifa, 2010. (Oldalszám: 1031-1038.)
- Budgeted distribution learning of belief net parameters.
Szerzők: Li, L.; Póczos, B.; Szepesvári, CsabaMegjelenés: 2010.Megjelent: ICML 2010. Proceedings of the 27th international conference on machine learning. Haifa, 2010. (Oldalszám: 879-886.)
- Estimation of Rényi entropy and mutual information based on generalized nearest-neighbor graphs.
Szerzők: Pál, D.; Póczos, B.; Szepesvári, CsabaMegjelenés: 2010.Megjelent: NIPS 2010. Twenty-fourth annual conference on neural information processing systems. Proceedings. Vancouver, 2010. (Terjedelem: 1-9. oldal)Link a cikkre: [pdf]
- Toward off-policy learning control with function approximation.
Szerzők: Maei, H.; Szepesvári, Csaba; Bhatnagar, S.; Sutton, R. S.Megjelenés: 2010.Megjelent: ICML 2010. Proceedings of the 27th international conference on machine learning. Haifa, 2010. (Oldalszám: 719-726.)
2009.- Training parsers by inverse reinforcement learning.

- Exploration-exploitation tradeoff using variance estimates in multi-armed bandits.
Szerzők: Audibert, Jean-Yves; Munos, Remi; Szepesvári, CsabaMegjelenés: 2009.Megjelent: Theoretical Computer Science (Kötetszám: 410, Füzetszám: 19, Oldalszám: 1876-1902.)Link a cikkre: [pdf]
- LMS-2: Towards an algorithm that is as cheap as LMS and almost as efficient as RLS
Szerzők: Yao, Hengshuai; Bhatnagar, Shalabh; Szepesvári, CsabaMegjelenés: 2009.Megjelent: Control and Decision Conference (CDC-09) (Terjedelem: 8 oldal)
- Learning to segment from a few well-selected training images.
Szerzők: Farhangfar, Alireza; Greiner, Russ; Szepesvári, CsabaMegjelenés: 2009.Megjelent: ICML 2009. 26th international conference on machine learning. Montreal, 2009. (ACM international conference proceeding series 382.) (Oldalszám: 305-312.)
- Learning when to stop thinking and do something!
Szerzők: Póczos, Barnabás; Abbasi-Yadkori, Yasin; Szepesvári, Csaba; Greiner, Russ; Sturtevant, NathanMegjelenés: 2009.Megjelent: ICML 2009. 26th international conference on machine learning. Montreal, 2009. (ACM international conference proceeding series 382.) (Oldalszám: 825-832.)
- Model-based and model-free reinforcement learning for visual servoing.
Szerzők: Farahmand, Amir massoud; Shademan, Azad; Jägersand, Martin; Szepesvári, CsabaMegjelenés: 2009.Megjelent: ICRA 2009. IEEE international conference on robotics and automation. Kobe, 2009. (Oldalszám: 2917-2924.)
2008.- Speeding up planning in Markov decision processes via automatically constructed abstractions.
- Active learning in multi-armed bandits.
 Szerzők: Antos, András; Grover, Varun; Szepesvári, CsabaSzerkesztő: Freund, Yoav; Györfi, László; Turán, György; Zuegmann, ThomasMegjelenés: 2008.Megjelent: ALT 2008. 19th international conference on algorithmic learning theory. Budapest, 2008. (Lecture notes in artificial intelligence 5254.) (Oldalszám: 288-303.)Link a cikkre: [ps.gz], [pdf], [pdf], [pdf]
- Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path.

- Dyna-style planning with linear function approximation and prioritized sweeping.
- Empirical Bernstein stopping.
- Active learning of group-structured environments.
- Regularized fitted Q-iteration: application to planning.
Szerzők: Farahmand, Amir massoud; Ghavamzadeh, Mohammad; Szepesvári, Csaba; Mannor, ShieMegjelenés: 2008.Megjelent: EWRL 2008. 8th European workshop on recent advances in reinforcement learning. Villeneuve d'Ascq, 2008. (Lecture notes in computer science 5323.) (Oldalszám: 55-68.)Link a cikkre: [pdf]
- Finite-time bounds for fitted value iteration.
Szerzők: Munos, Remi; Szepesvári , CsabaMegjelenés: 2008.Megjelent: Journal of Machine Learning Research (Kötetszám: 9, Oldalszám: 815-857.)Link a cikkre: [pdf]
2004.- Margin maximizing discriminant analysis
Szerzők: Kocsor, A; Kovács, K; Szepesvári, CSMegjelenés: 2004.Megjelent: LECTURE NOTES IN COMPUTER SCIENCE (Kötetszám: 3201, Oldalszám: 227-238)Link a cikkre: [pdf]
- Interpolation-based Q-learning
Szerzők: Szepesvári, CS; Smart, WDMegjelenés: 2004.Megjelent: Machine Learning. Proceedings of the 21th International Conference ICML 2004, Banff (Oldalszám: 791-798)Link a cikkre: [pdf]
- Kernel machine based feature extraction algorithms for regression problems
Szerzők: Szepesvári, CS; Kocsor, A; Kovács, KMegjelenés: 2004.Megjelent: ECAI 2004. Proceedings of the 16th European Conference on Artificial Intelligence, Valencia (Frontiers in Artificial Intelligence and Applications, 110) (Oldalszám: 1091-1092)Link a cikkre: [pdf]
- Shortest path discovery problems: a framework, algorithms and experimental results
Szerzők: Szepesvári, CSMegjelenés: 2004.Megjelent: Artificial Intelligence. Proceedings of the 19th National Conference AAAI-04, and Proceedings of the 16th Innovative Applications of AI (IAAI-04), San Jose. (AAAI-04/IAAI-04) (Oldalszám: 550-555)Link a cikkre: [pdf]
- Enhancing particle filters using local likelihood sampling
Szerzők: Torma, P; Szepesvári, CSMegjelenés: 2004.Megjelent: LECTURE NOTES IN COMPUTER SCIENCE (Kötetszám: 3021, Oldalszám: 16-27)Link a cikkre: [pdf]
Új keresés
|