- Szepesvári Csaba
Publikációk[ Időrendben]
[ Kategóriákba sorolva ]
[ Szerzőnként]
ISI folyóiratcikk- Models of active learning in group-structured state spaces.
Szerzők: Bartók, Gábor; Szepesvári, Csaba; Zilles, S.Megjelenés: 2010.Megjelent: Information and Computation (Kötetszám: 208, Oldalszám: 364-384.)
- Active learning in heteroscedastic noise.

- Exploration-exploitation tradeoff using variance estimates in multi-armed bandits.
Szerzők: Audibert, Jean-Yves; Munos, Remi; Szepesvári, CsabaMegjelenés: 2009.Megjelent: Theoretical Computer Science (Kötetszám: 410, Füzetszám: 19, Oldalszám: 1876-1902.)Link a cikkre: [pdf]
- Training parsers by inverse reinforcement learning.

- Finite-time bounds for fitted value iteration.
Szerzők: Munos, Remi; Szepesvári , CsabaMegjelenés: 2008.Megjelent: Journal of Machine Learning Research (Kötetszám: 9, Oldalszám: 815-857.)Link a cikkre: [pdf]
- Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path.

- Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path

- Bandit based Monte-Carlo planning
- RSPSA: enhanced parameter optimisation in games
- Universal parameter Optimisation in games based on SPSA
Konferenciakiadvány- Toward off-policy learning control with function approximation.
Szerzők: Maei, H.; Szepesvári, Csaba; Bhatnagar, S.; Sutton, R. S.Megjelenés: 2010.Megjelent: ICML 2010. Proceedings of the 27th international conference on machine learning. Haifa, 2010. (Oldalszám: 719-726.)
- A General Projection Property for Distribution Families
Szerzők: Yu, Yaoliang; Li, Yuxi; Szepesvári, Csaba; Schuurmans, DaleMegjelenés: 2010.Megjelent: Neural Information Processing Systems (NIPS-22) (Terjedelem: 9 oldal)
- Convergent Temporal-Difference Learning with Arbitrary Differentiable Function Approximator
Szerzők: Maei, Hamid Reza; Szepesvári, Csaba; Bhathnagar, Shalabh; Silver, David; Precup, Doina; Sutton, RichardMegjelenés: 2010.Megjelent: Neural Information Processing Systems (NIPS-22) (Terjedelem: 9 oldal)
- The online loop-free stochastic shortest-path problem.
- Error propagation for approximate policy and value iteration.
Szerzők: Farahmand, A. M.; Munos, R.; Szepesvári, CsabaMegjelenés: 2010.Megjelent: NIPS 2010. Twenty-fourth annual conference on neural information processing systems. Proceedings. Vancouver, 2010. (Terjedelem: 1-9. oldal)Link a cikkre: [pdf]
- Model-based reinforcement learning with nearly tight exploration complexity bounds.
Szerzők: Szita, I.; Szepesvári, CsabaMegjelenés: 2010.Megjelent: ICML 2010. Proceedings of the 27th international conference on machine learning. Haifa, 2010. (Oldalszám: 1031-1038.)
- Budgeted distribution learning of belief net parameters.
Szerzők: Li, L.; Póczos, B.; Szepesvári, CsabaMegjelenés: 2010.Megjelent: ICML 2010. Proceedings of the 27th international conference on machine learning. Haifa, 2010. (Oldalszám: 879-886.)
- Estimation of Rényi entropy and mutual information based on generalized nearest-neighbor graphs.
Szerzők: Pál, D.; Póczos, B.; Szepesvári, CsabaMegjelenés: 2010.Megjelent: NIPS 2010. Twenty-fourth annual conference on neural information processing systems. Proceedings. Vancouver, 2010. (Terjedelem: 1-9. oldal)Link a cikkre: [pdf]
- LMS-2: Towards an algorithm that is as cheap as LMS and almost as efficient as RLS
Szerzők: Yao, Hengshuai; Bhatnagar, Shalabh; Szepesvári, CsabaMegjelenés: 2009.Megjelent: Control and Decision Conference (CDC-09) (Terjedelem: 8 oldal)
- Learning when to stop thinking and do something!
Szerzők: Póczos, Barnabás; Abbasi-Yadkori, Yasin; Szepesvári, Csaba; Greiner, Russ; Sturtevant, NathanMegjelenés: 2009.Megjelent: ICML 2009. 26th international conference on machine learning. Montreal, 2009. (ACM international conference proceeding series 382.) (Oldalszám: 825-832.)
- Model-based and model-free reinforcement learning for visual servoing.
Szerzők: Farahmand, Amir massoud; Shademan, Azad; Jägersand, Martin; Szepesvári, CsabaMegjelenés: 2009.Megjelent: ICRA 2009. IEEE international conference on robotics and automation. Kobe, 2009. (Oldalszám: 2917-2924.)
- Learning to segment from a few well-selected training images.
Szerzők: Farhangfar, Alireza; Greiner, Russ; Szepesvári, CsabaMegjelenés: 2009.Megjelent: ICML 2009. 26th international conference on machine learning. Montreal, 2009. (ACM international conference proceeding series 382.) (Oldalszám: 305-312.)
- Speeding up planning in Markov decision processes via automatically constructed abstractions.
- Active learning in multi-armed bandits.
 Szerzők: Antos, András; Grover, Varun; Szepesvári, CsabaSzerkesztő: Freund, Yoav; Györfi, László; Turán, György; Zuegmann, ThomasMegjelenés: 2008.Megjelent: ALT 2008. 19th international conference on algorithmic learning theory. Budapest, 2008. (Lecture notes in artificial intelligence 5254.) (Oldalszám: 288-303.)Link a cikkre: [ps.gz], [pdf], [pdf], [pdf]
- Dyna-style planning with linear function approximation and prioritized sweeping.
- Regularized fitted Q-iteration: application to planning.
Szerzők: Farahmand, Amir massoud; Ghavamzadeh, Mohammad; Szepesvári, Csaba; Mannor, ShieMegjelenés: 2008.Megjelent: EWRL 2008. 8th European workshop on recent advances in reinforcement learning. Villeneuve d'Ascq, 2008. (Lecture notes in computer science 5323.) (Oldalszám: 55-68.)Link a cikkre: [pdf]
- Empirical Bernstein stopping.
- Active learning of group-structured environments.
- Value-iteration based fitted policy iteration: learning with a single trajectory.
- Continuous time associative bandit problems.
- Fitted Q-iteration in continuous action-space MDPs.
- Finite time bounds for sampling based fitted value iteration
Szerzők: Szepesvári, Cs; Munos, RMegjelenés: 2005.Megjelent: ICML 2005. 22nd international conference on machine learning. Bonn, 2005. (Oldalszám: 881-886)
- Log-optimal currency portfolios and control Lyapunov exponents
- On using likelihood-adjusted proposals in paprticle filtering: local importance sampling
Szerzők: Torma, P; Szepesvári, CsMegjelenés: 2005.Megjelent: ISPA 2005. 4th international symposium on image and signal processing and analysis. Zagreb, 2005. (Oldalszám: 58-63)
- Interpolation-based Q-learning
Szerzők: Szepesvári, CS; Smart, WDMegjelenés: 2004.Megjelent: Machine Learning. Proceedings of the 21th International Conference ICML 2004, Banff (Oldalszám: 791-798)Link a cikkre: [pdf]
- Kernel machine based feature extraction algorithms for regression problems
Szerzők: Szepesvári, CS; Kocsor, A; Kovács, KMegjelenés: 2004.Megjelent: ECAI 2004. Proceedings of the 16th European Conference on Artificial Intelligence, Valencia (Frontiers in Artificial Intelligence and Applications, 110) (Oldalszám: 1091-1092)Link a cikkre: [pdf]
- Shortest path discovery problems: a framework, algorithms and experimental results
Szerzők: Szepesvári, CSMegjelenés: 2004.Megjelent: Artificial Intelligence. Proceedings of the 19th National Conference AAAI-04, and Proceedings of the 16th Innovative Applications of AI (IAAI-04), San Jose. (AAAI-04/IAAI-04) (Oldalszám: 550-555)Link a cikkre: [pdf]
- Sequential importance sampling for visual tracking reconsidered
Szerzők: Torma, P; Szepesvári, CSMegjelenés: 2003.Megjelent: Proceedings of 9th international workshop on artificial intelligence and statistics. AISTATS-03. Key West, 2003 (Oldalszám: 271-278)Link a cikkre: [pdf]
Új keresés
|