Szepesvári Csaba
Cím: 1111 Budapest, Kende u. 13-17.
Szoba: K 303
Telefon: +36 1 279 6262
E-mail: szcsabaEZT_TOROLJE_KI@EZT_TOROLJE_KIsztaki.hu
Honlap: http://www.sztaki.hu/~szcsaba
Részleg:

Publikációk

[Időrendben] [Kategóriákba sorolva ] [Szerzőnként]

2010.

Convergent Temporal-Difference Learning with Arbitrary Differentiable Function Approximator
Szerzők: Maei, Hamid Reza; Szepesvári, Csaba; Bhathnagar, Shalabh; Silver, David; Precup, Doina; Sutton, Richard
Megjelenés: 2010.
Megjelent: Neural Information Processing Systems (NIPS-22) (Terjedelem: 9 oldal)
A General Projection Property for Distribution Families
Szerzők: Yu, Yaoliang; Li, Yuxi; Szepesvári, Csaba; Schuurmans, Dale
Megjelenés: 2010.
Megjelent: Neural Information Processing Systems (NIPS-22) (Terjedelem: 9 oldal)
Models of active learning in group-structured state spaces.
Szerzők: Bartók, Gábor; Szepesvári, Csaba; Zilles, S.
Megjelenés: 2010.
Megjelent: Information and Computation (Kötetszám: 208, Oldalszám: 364-384.)
Active learning in heteroscedastic noise.
Szerzők: Antos, András; Grover, Varun; Szepesvári, Csaba
Megjelenés: 2010.
Megjelent: Theoretical Computer Science (Kötetszám: 411, Oldalszám: 2712-2728.)
Link a cikkre: [html], [pdf], [pdf]
The online loop-free stochastic shortest-path problem.
Szerzők: Neu, Gergely; György, András; Szepesvári, Csaba
Megjelenés: 2010.
Megjelent: COLT 2010. 23rd Annual conference on learning theory. Haifa, 2010. (Oldalszám: 231-243.)
Link a cikkre: [pdf]
Error propagation for approximate policy and value iteration.
Szerzők: Farahmand, A. M.; Munos, R.; Szepesvári, Csaba
Megjelenés: 2010.
Megjelent: NIPS 2010. Twenty-fourth annual conference on neural information processing systems. Proceedings. Vancouver, 2010. (Terjedelem: 1-9. oldal)
Link a cikkre: [pdf]
Model-based reinforcement learning with nearly tight exploration complexity bounds.
Szerzők: Szita, I.; Szepesvári, Csaba
Megjelenés: 2010.
Megjelent: ICML 2010. Proceedings of the 27th international conference on machine learning. Haifa, 2010. (Oldalszám: 1031-1038.)
Budgeted distribution learning of belief net parameters.
Szerzők: Li, L.; Póczos, B.; Szepesvári, Csaba
Megjelenés: 2010.
Megjelent: ICML 2010. Proceedings of the 27th international conference on machine learning. Haifa, 2010. (Oldalszám: 879-886.)
Estimation of Rényi entropy and mutual information based on generalized nearest-neighbor graphs.
Szerzők: Pál, D.; Póczos, B.; Szepesvári, Csaba
Megjelenés: 2010.
Megjelent: NIPS 2010. Twenty-fourth annual conference on neural information processing systems. Proceedings. Vancouver, 2010. (Terjedelem: 1-9. oldal)
Link a cikkre: [pdf]
Toward off-policy learning control with function approximation.
Szerzők: Maei, H.; Szepesvári, Csaba; Bhatnagar, S.; Sutton, R. S.
Megjelenés: 2010.
Megjelent: ICML 2010. Proceedings of the 27th international conference on machine learning. Haifa, 2010. (Oldalszám: 719-726.)

2009.

Training parsers by inverse reinforcement learning.
Szerzők: Neu, Gergely; Szepesvári, Csaba
Megjelenés: 2009.
Megjelent: Machine Learning (Kötetszám: 77, Füzetszám: 2-3, Oldalszám: 303-337.)
Link a cikkre: [pdf]
Exploration-exploitation tradeoff using variance estimates in multi-armed bandits.
Szerzők: Audibert, Jean-Yves; Munos, Remi; Szepesvári, Csaba
Megjelenés: 2009.
Megjelent: Theoretical Computer Science (Kötetszám: 410, Füzetszám: 19, Oldalszám: 1876-1902.)
Link a cikkre: [pdf]
LMS-2: Towards an algorithm that is as cheap as LMS and almost as efficient as RLS
Szerzők: Yao, Hengshuai; Bhatnagar, Shalabh; Szepesvári, Csaba
Megjelenés: 2009.
Megjelent: Control and Decision Conference (CDC-09) (Terjedelem: 8 oldal)
Learning to segment from a few well-selected training images.
Szerzők: Farhangfar, Alireza; Greiner, Russ; Szepesvári, Csaba
Megjelenés: 2009.
Megjelent: ICML 2009. 26th international conference on machine learning. Montreal, 2009. (ACM international conference proceeding series 382.) (Oldalszám: 305-312.)
Learning when to stop thinking and do something!
Szerzők: Póczos, Barnabás; Abbasi-Yadkori, Yasin; Szepesvári, Csaba; Greiner, Russ; Sturtevant, Nathan
Megjelenés: 2009.
Megjelent: ICML 2009. 26th international conference on machine learning. Montreal, 2009. (ACM international conference proceeding series 382.) (Oldalszám: 825-832.)
Model-based and model-free reinforcement learning for visual servoing.
Szerzők: Farahmand, Amir massoud; Shademan, Azad; Jägersand, Martin; Szepesvári, Csaba
Megjelenés: 2009.
Megjelent: ICRA 2009. IEEE international conference on robotics and automation. Kobe, 2009. (Oldalszám: 2917-2924.)

2008.

Speeding up planning in Markov decision processes via automatically constructed abstractions.
Szerzők: Isaza, Alejandro; Szepesvári, Csaba; Bulitko, Vadim; Greiner, Russel
Szerkesztő: McAllester, David A.; Myllymäki, Petri
Megjelenés: 2008.
Megjelent: UAI 2008. Proceedings of the 24th conference in uncertainty in artificial intelligence. Helsinki, 2008. (Oldalszám: 306-314.)
Link a cikkre: [pdf]
Active learning in multi-armed bandits.
Szerzők: Antos, András; Grover, Varun; Szepesvári, Csaba
Szerkesztő: Freund, Yoav; Györfi, László; Turán, György; Zuegmann, Thomas
Megjelenés: 2008.
Megjelent: ALT 2008. 19th international conference on algorithmic learning theory. Budapest, 2008. (Lecture notes in artificial intelligence 5254.) (Oldalszám: 288-303.)
Link a cikkre: [ps.gz], [pdf], [pdf], [pdf]
Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path.
Szerzők: Antos, András; Szepesvári, Csaba; Munos, Rémi
Megjelenés: 2008.
Megjelent: Machine Learning (Kötetszám: 71, Füzetszám: DOI: 10.1007/s10994-007-5038-2, Oldalszám: 89-129.)
Link a cikkre: [html], [ps.gz], [pdf]
Dyna-style planning with linear function approximation and prioritized sweeping.
Szerzők: Sutton, Richard S.; Szepesvári, Csaba; Geramifard, Alborz; Bowling, Michael H.
Szerkesztő: McAllester, David A.; Myllymäki, Petri
Megjelenés: 2008.
Megjelent: UAI 2008. Proceedings of the 24th conference in uncertainty in artificial intelligence. Helsinki, 2008. (Oldalszám: 528-536.)
Link a cikkre: [pdf]
Empirical Bernstein stopping.
Szerzők: Mnih, Volodymyr; Szepesvári, Csaba; Audibert, Jean-Yves
Megjelenés: 2008.
Megjelent: ICML 2008. 25th international conference on machine learning. Helsinki, 2008. (ACM international conference proceeding series 307.) (Oldalszám: 672-679.)
Link a cikkre: [pdf]
Active learning of group-structured environments.
Szerzők: Bartók, Gábor; Szepesvári, Csaba; Zilles, Sandra
Megjelenés: 2008.
Megjelent: ALT 2008. 19th international conference on algorithmic learning theory. Budapest, 2008. (Lecture notes in artificial intelligence 5254.) (Oldalszám: 329-343.)
Link a cikkre: [pdf]
Regularized fitted Q-iteration: application to planning.
Szerzők: Farahmand, Amir massoud; Ghavamzadeh, Mohammad; Szepesvári, Csaba; Mannor, Shie
Megjelenés: 2008.
Megjelent: EWRL 2008. 8th European workshop on recent advances in reinforcement learning. Villeneuve d'Ascq, 2008. (Lecture notes in computer science 5323.) (Oldalszám: 55-68.)
Link a cikkre: [pdf]
Finite-time bounds for fitted value iteration.
Szerzők: Munos, Remi; Szepesvári , Csaba
Megjelenés: 2008.
Megjelent: Journal of Machine Learning Research (Kötetszám: 9, Oldalszám: 815-857.)
Link a cikkre: [pdf]

2007.

Value-iteration based fitted policy iteration: learning with a single trajectory.
Fitted Q-iteration in continuous action-space MDPs.
Szerzők: Antos, András; Munos, Rémi; Szepesvári, Csaba
Szerkesztő: McCallum, A.
Megjelenés: 2007.
Megjelent: NIPS 2007. Proceedings of 21th annual conference on neural information processing systems. Vancouver, 2007. (Oldalszám: 1-8.)
Link a cikkre: [ps.gz]
Continuous time associative bandit problems.
Szerzők: György, András; Kocsis, Levente; Szabó, Ivett; Szepesvári, Csaba
Megjelenés: 2007.
Megjelent: ICJAI 2007. 20th international joint conference on artificial intelligence. Hyderabad, 2007. (Oldalszám: 830-835.)
Link a cikkre: [pdf]

2006.

Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path
Szerzők: Antos, András; Szepesvári, Csaba; Munos, R.
Megjelenés: 2006.
Megjelent: Lecture Notes in Computer Science (Kötetszám: 4005, Oldalszám: 574-588)
Link a cikkre: [ps.gz], [pdf], [html], [pdf]
Bandit based Monte-Carlo planning
Szerzők: Kocsis, Levente; Szepesvári, Csaba
Megjelenés: 2006.
Megjelent: Lecture Notes in Artificial Intelligence (Kötetszám: 4212, Oldalszám: 282-293)
Universal parameter Optimisation in games based on SPSA
Szerzők: Kocsis, Levente; Szepesvári, Csaba
Megjelenés: 2006.
Megjelent: Machine Learning (Kötetszám: 63, Füzetszám: 3, Oldalszám: 249-286)
RSPSA: enhanced parameter optimisation in games
Szerzők: Kocsis, Levente; Szepesvári, Csaba; Winands, MHM
Megjelenés: 2006.
Megjelent: Lecture Notes in Computer Science (Kötetszám: 4250, Oldalszám: 39-56)
Local importance sampling: a novel technique to enhance particle filtering
Szerzők: Torma, P; Szepesvári, Csaba
Megjelenés: 2006.
Megjelent: Journal of Multimedia (Kötetszám: 1, Füzetszám: 1, Oldalszám: 32-43)
Link a cikkre: [pdf]

2005.

Finite time bounds for sampling based fitted value iteration
Szerzők: Szepesvári, Cs; Munos, R
Megjelenés: 2005.
Megjelent: ICML 2005. 22nd international conference on machine learning. Bonn, 2005. (Oldalszám: 881-886)
On using likelihood-adjusted proposals in paprticle filtering: local importance sampling
Szerzők: Torma, P; Szepesvári, Cs
Megjelenés: 2005.
Megjelent: ISPA 2005. 4th international symposium on image and signal processing and analysis. Zagreb, 2005. (Oldalszám: 58-63)
Log-optimal currency portfolios and control Lyapunov exponents
Szerzők: Gerencsér, L; Rásonyi, M; Szepesvári, Cs; Vágó, Zs
Részleg: Celluláris Érzékelő és Optikai Hullámszámítógépek Kutatólaboratórium
Megjelenés: 2005.
Megjelent: CDC’05-ECC'05. Proceedings of the 44th IEEE conference on decision and control, and the European control conference 2005. Seville, 2005. (Oldalszám: 1764-1769)

2004.

Margin maximizing discriminant analysis
Szerzők: Kocsor, A; Kovács, K; Szepesvári, CS
Megjelenés: 2004.
Megjelent: LECTURE NOTES IN COMPUTER SCIENCE (Kötetszám: 3201, Oldalszám: 227-238)
Link a cikkre: [pdf]
Interpolation-based Q-learning
Szerzők: Szepesvári, CS; Smart, WD
Megjelenés: 2004.
Megjelent: Machine Learning. Proceedings of the 21th International Conference ICML 2004, Banff (Oldalszám: 791-798)
Link a cikkre: [pdf]
Kernel machine based feature extraction algorithms for regression problems
Szerzők: Szepesvári, CS; Kocsor, A; Kovács, K
Megjelenés: 2004.
Megjelent: ECAI 2004. Proceedings of the 16th European Conference on Artificial Intelligence, Valencia (Frontiers in Artificial Intelligence and Applications, 110) (Oldalszám: 1091-1092)
Link a cikkre: [pdf]
Shortest path discovery problems: a framework, algorithms and experimental results
Szerzők: Szepesvári, CS
Megjelenés: 2004.
Megjelent: Artificial Intelligence. Proceedings of the 19th National Conference AAAI-04, and Proceedings of the 16th Innovative Applications of AI (IAAI-04), San Jose. (AAAI-04/IAAI-04) (Oldalszám: 550-555)
Link a cikkre: [pdf]
Enhancing particle filters using local likelihood sampling
Szerzők: Torma, P; Szepesvári, CS
Megjelenés: 2004.
Megjelent: LECTURE NOTES IN COMPUTER SCIENCE (Kötetszám: 3021, Oldalszám: 16-27)
Link a cikkre: [pdf]

2003.

Sequential importance sampling for visual tracking reconsidered
Szerzők: Torma, P; Szepesvári, CS
Megjelenés: 2003.
Megjelent: Proceedings of 9th international workshop on artificial intelligence and statistics. AISTATS-03. Key West, 2003 (Oldalszám: 271-278)
Link a cikkre: [pdf]
Performance of nonlinear approximate adaptive controllers
Szerzők: French, M; Szepesvári, CS; Rogers, E
Megjelenés: 2003.
Megjelent: Performance of nonlinear approximate adaptive controllers (Oldalszám: 412)

Új keresés