- Benczúr András, Ph.D., laborvezető
- Cím: 1111 Budapest, Lágymányosi u. 11.
Szoba: L 412
Telefon: +36 1 279 6172
Fax: +36 1 209 5269
E-mail: benczur@sztaki.mta.hu
Honlap: http://datamining.sztaki.hu/
Részleg: Informatikai Kutatólaboratórium
Benczúr András 1997-ben szerezte Ph.D. fokozatát a Massachusetts Institute of Technology-n alkalmazott matematikából. Azóta az MTA SZTAKI Informatika Kutató Laboratórium munkatársa. 2000-ben alapította a laboron belül az Adatbányászat és Webkeresés Kutatócsoportot, amelyben ma 3 vezető kutató, 3 posztdoktor és számos Ph.D. hallgató és fejlesztő tevékenykedik.
A kutatócsoport eredményei egyedi megoldásokat biztosítanak extrém méretű rendszerek (nagy belső hálózatok, nagyforgalmú Web portálok), illetve a magyar nyelvű információkeresés számára. A csoport hazai és nemzetközi együttműködésben szociális hálózatok, biztonsági incidensek és ügyféladatok elemzését, illetve a Web spam szűrését végzi; eredményeit a 2006/07 akadémiai évben Yahoo! Faculty Research Grant támogatással ismerték el, illetve a KDD Cup 2007 győztes megoldása is a csoport nevéhez fűződik. A végzett doktoranduszok közül már öten dolgoznak a legnagyobb Internetes keresőcégek (Google, Yahoo) kutató-fejlesztő központjaiban.
András "Big Data" kutatási témája az MTA Elnöke által adományozott "<a href="http://mta.hu/mta_hirei/adattomegbol-hasznos-informacio-130155/">Lendület</a>" kutatócsoport támogatásban részesült 2012-ben.
Publikációk
[Időrendben] [Kategóriákba sorolva ]2012.
- Flexible and Efficient Distributed Resolution of Large Entities
- Szerzők: Molnár, András, J.; Sidló, Csaba István; Benczúr, András, A.
Megjelenés: 2012.
Megjelent: FoIKS 2012, LNCS 7153 (Oldalszám: 2)
- Content-based trust and bias classification via biclustering
- Szerzők: Siklósi, Dávid; Daróczy, Bálint Zoltán; Benczúr, András A.
Megjelenés: 2012.
Megjelent: Proceeding WebQuality '12 Proceedings of the 2nd Joint WICOW/AIRWeb Workshop on Web Quality (Oldalszám: 4)
- Big Web Analytics: Toward a Virtual Web Observatory
- Szerzők: Spaniol, Marc; Benczúr, András; Viharos, Zsolt János; Weikum, Gerhard
Megjelenés: 2012.
Megjelent: ERCIM News (Oldalszám: 2)
2011.
- Temporal analysis for web spam detection: an overview
- Szerzők: Erdélyi, Miklós; Benczúr, András
Megjelenés: 2011.
Megjelent: TWAW 2011. Proceedings of the 1st international temporal web analytics workshop. Hyderabad, 2011. (Oldalszám: 1)
- Web spam classification: a few features worth more
- Szerzők: Erdélyi, Miklós; Garzó, András; Benczúr, András
Megjelenés: 2011.
Megjelent: WebQuality 2011. Joint WICOW/AIRWeb workshop on web quality. Hyderabad, 2011. (Oldalszám: 2)
- SZTAKI @ ImageCLEF 2011
- Szerzők: Daróczy, Bálint Zoltán; Pethes, Róbert; Benczúr, András
Megjelenés: 2011.
Megjelent: CLEF 2011. Conference on multilingual and multimodal information access evaluation. Amsterdam, 2011.
- Longitudinal analytics on web archive data: it's about time!
- Szerzők: Weikum, G.; Ntarmos, N.; Spaniol, M.; Triantafillou, P.; Benczúr, András; Kirkpatrick, S.; Rigaux, P.; Williamson, M.
Megjelenés: 2011.
Megjelent: CIDR 2011. 5th biennial conference on innovative data systems research. Asilomar, 2011. (Oldalszám: 1)
- Infrastructures and bound for distributed entity resolution
- Szerzők: Sidló, Csaba István; Garzó, András; Molnár, András; Benczúr, András
Megjelenés: 2011.
Megjelent: QDB 2011.9th international workshop on quality in databases. Seattle, 2011. (Oldalszám: 1)
- Longitudinal Analytics on Web Archive Data: It's About Time!
- Szerzők: Weikum, Gerhard; Ntarmos, Nikos; Spaniol, Marc; Triantafillou, Peter; Benczúr, András; Scott, Kirkpatrick; Rigaux, Philippe; Williamson, Mark
Megjelenés: 2011.
Megjelent: 5th Biennial Conference on Innovative Data Systems Research
2010.
- SZTAKI @ TRECVID 2010
- Szerzők: Daróczy, Bálint Zoltán; Falavigna, Daniele; Gretter, Roberto; Nemeskey, Dávid Márk; Petrás, István; Pethes, Róbert; Benczúr, András
Megjelenés: 2010.
Megjelent: TRECVID 2010 Working Notes.
- An efficient block model for clustering sparse graphs
- Szerzők: Gyenge, Ádám Balázs; Sinkkonen, Janne; Benczúr, András
Megjelenés: 2010.
Megjelent: MLG 2010. Proceedings of the 8th workshop on mining and learning with graphs, in conjunction with SIGKDD 2010. Washington, 2010. (Oldalszám: 6)
- SZTAKI @ TREC 2010
- Szerzők: Garzó, András; Nemeskey, Dávid Márk; Pethes, Róbert; Siklósi, Dávid; Benczúr, András
Megjelenés: 2010.
Megjelent: TREC 2010 Working Notes
- SZTAKI @ ImageCLEF 2010
- Szerzők: Daróczy, Bálint Zoltán; Petrás, István; Benczúr, András; Nemeskey, Dávid Márk; Pethes, Róbert
Megjelenés: 2010.
Megjelent: CLEF 2010. Conference on multilingual and multimodal information access evaluation. Notebook Papers of CLEF 2010 LABs and workshops. Padua, 2010. (Oldalszám: 1)
- Interest point and segmentation-based photo annotation
- Szerzők: Daróczy, Bálint Zoltán; Petrás, István; Benczúr, András; Fekete, Zsolt; Nemeskey, Dávid Márk; Siklósi, Dávid; Weiner, Zsuzsa
Megjelenés: 2010.
Megjelent: CLEF 2009 workshop. Multilingual information access evaluation II. Multimedia experiments. Corfu, 2009. (Lecture notes in computer science 6242.) (Oldalszám: 3)
- Geographically organized small communities and the hardness of clustering social networks
- Szerzők: Kurucz, Miklós; Benczúr, András
Megjelenés: 2010.
Megjelent: Data mining for social network data, (Annals of information systems 12.) (Oldalszám: 1)
2009.
- Telephone call network data mining: a survey with experiments
- Szerzők: Kurucz, Miklós; Lukács, László; Siklósi, Dávid; Benczúr, András; Csalogány, Károly; Lukács, András
Szerkesztő: Bollobás, B.; Kozma, R.; Miklós, D.
Megjelenés: 2009.
Megjelent: Handbook of large-scale random networks. (Bolyai Society mathematical studies 18.) (Oldalszám: 1)
- Web spam challenge proposal for filtering in archives
- Szerzők: Benczúr, András; Erdélyi, Miklós Bálint; Masanes, Julien; Siklósi, Dávid
Megjelenés: 2009.
Megjelent: Airweb 2009. Proceedings of the 5th international workshop on adversarial information retrieval on the web. Madrid, 2009. (Oldalszám: 6)
- Web spam filtering in internet archives
- Szerzők: Erdélyi, Miklós Bálint; Benczúr, András; Masanes, Julien; Siklósi, Dávid
Megjelenés: 2009.
Megjelent: Airweb 2009. Proceedings of the 5th international workshop on adversarial information retrieval on the web. Madrid, 2009. (Oldalszám: 1)
- SZTAKI@ImageCLEF 2008: visual feature analysis in segmented images
- Szerzők: Daróczy, Bálint Zoltán; Fekete, Zsolt; Brendel, Mátyás; Rácz, Simon; Benczúr, András; Siklósi, Dávid; Pereszlényi, Attila
Megjelenés: 2009.
Megjelent: CLEF 2008. Evaluating systems for multilingual and multimodal information access. 9th workshop on the cross-language evaluation forum. Aarhus, 2008. (Lecture notes in computer science 5706.) (Oldalszám: 6)
- SZTAKI @ TRECVID 2009
- Szerzők: Daróczy, Bálint Zoltán; Nemeskey, Dávid Márk; Petrás, István; Benczúr, András; Kiss, Tamás
Megjelenés: 2009.
Megjelent: TRECVID 2009. TREC video retrieval evaluation. Working Notes.
- Linked latent dirichlet allocation in web spam filtering
- Szerzők: Biró, István; Siklósi, Dávid; Szabó, Jácint; Benczúr, András
Megjelenés: 2009.
Megjelent: Airweb 2009. Proceedings of the 5th international workshop on adversarial information retrieval on the web. Madrid, 2009. (Oldalszám: 3)
- SZTAKI @ ImageCLEF 2009
- Szerzők: Daróczy, Bálint Zoltán; Petrás, István; Benczúr, András; Fekete, Zsolt; Nemeskey, Dávid Márk; Siklósi, Dávid; Weiner, Zsuzsa
Megjelenés: 2009.
Megjelent: 10th Workshop of the Cross-Language Evaluation Forum, CLEF 2009
- Kapcsolatok és távolságok: a hazai vezetékes hívás-szokások elemzése
- Szerzők: Kurucz, Miklós; Siklósi, Dávid; Csalogány, Károly; Lukács, László; Benczúr, András; Lukács, András
Megjelenés: 2009.
Megjelent: Magyar Tudomány (Oldalszám: 6)
2008.
- Primal-dual approach for directed vertex connectivity augmentation and generalizations
- Szerzők: Végh, László; Benczúr, András
Megjelenés: 2008.
Megjelent: ACM Transactions on Algorithms (Oldalszám: 2)
- Web Spam Hunting @ Budapest
- Szerzők: Siklósi, Dávid; Benczúr, András; Fekete, Zsolt; Kurucz, Miklós; Bíró, István; Pereszlényi, Attila; Rácz, Simon; Szabó, Adrienn; Szabó, Jácint
Megjelenés: 2008.
Megjelent: Proc. Airweb 2008 in conjunction with WWW 2008
- Web spam: a survey with vision for the archivist
- Szerzők: Benczúr, András; Siklósi, Dávid; Szabó, Jácint; Bíró, István; Fekete, Zsolt; Kurucz, Miklós; Pereszlényi, Attila; Rácz, Simon; Szabó, Adrienn
Megjelenés: 2008.
Megjelent: IWAW 2008. 8th international web archiving workshop. Aarhus, 2008. (Oldalszám: 1)
- A comparative analysis of latent variable models for web page classification
- Szerzők: Bíró, István; Benczúr, András; Szabó, Jácint; Maguitman, Ana
Megjelenés: 2008.
Megjelent: LA-Web 2008. IEEE Latin American web conference 2008. Espírito Santo, 2008. (Oldalszám: 2)
- Overview of the imageCLEF 2007 object retrieval task
- Szerzők: Deselaers, Thomas; Hanbury, Allan; Viitaniemi, Ville; Benczúr, András; Brendel, Mátyás; Daróczy, Bálint Zoltán; Balderas, Hugo Jair Escalante; Gevers, Theo; Gracidas, Carlos Arturo Hernández; Hoi, Steven C. H.; Laaksonen, Jorma; Li, Mingjing; Castro, Heidy Marisol Marin; Ney, Hermann; Rui, Xiaoguang; Sebe, Nicu; Stöttinger, Julian; Wu, Lei
Megjelenés: 2008.
Megjelent: CLEF 2007. Advances in multilingual and multimodal information retrieval. 8th workshop of the cross-language evaluation forum. Budapest, 2007. (Lecure notes in computer science 5152.) (Oldalszám: 4)
- Multimodal retrieval by text--segment biclustering
- Szerzők: Benczúr, András; Bíró, István; Brendel, Mátyás; Csalogány, Károly; Daróczy, Bálint Zoltán; Siklósi, Dávid
Megjelenés: 2008.
Megjelent: CLEF 2007. Advances in multilingual and multimodal information retrieval. 8th workshop of the cross-language evaluation forum. Budapest, 2007. (Lecure notes in computer science 5152.)
- Deformable polygon representation and near-mincuts
- Szerzők: Benczúr, András; Goemans, Michel X.
Szerkesztő: Grötschel, M.; Katona, G. O. H.
Megjelenés: 2008.
Megjelent: Bilding bridges. Between mathematics and computer science. In honour of Laci Lovász. Budapest, 2008. (Bolyai Society mathematical studies 19.) (Oldalszám: 1)
- Increasing cluster recall of cross-modal image retrieval
- Szerzők: Rácz, Simon; Daróczy, Bálint Zoltán; Siklósi, Dávid; Pereszlényi, Attila; Brendel, Mátyás; Benczúr, András
Megjelenés: 2008.
Megjelent: CLEF 2008. Cross language evaluation forum. Aarhus, 2008. (Oldalszám: 1)
- Large-scale principal component analysis on LiveJournal friends network
- Szerzők: Kurucz, Miklós; Benczúr, András; Pereszlényi, Attila
Megjelenés: 2008.
Megjelent: KDD 2008. Proceedings of the 2nd KDD workshop on social network mining and analysis, held in conjunction with SIGKDD'08. Las Vegas, 2008. (Oldalszám: 1)
- Latent dirichlet allocation in web spam filtering
- Szerzők: Bíró, István; Benczúr, András; Szabó, Jácint
Szerkesztő: Castillo, C.; Chellapilla, K.; Fettery, D.
Megjelenés: 2008.
Megjelent: Airweb 2008. Proceedings of the 4th international workshop on adversarial information retrieval on the web. Beijing, 2008. (Oldalszám: 2)
- Cross-language retrieval with wikipedia
- Szerzők: Schönhofen, Péter; Benczúr, András; Bíró, István; Csalogány, Károly
Megjelenés: 2008.
Megjelent: CLEF 2007. Advances in multilingual and multimodal information retrieval. 8th workshop of the cross-language evaluation forum. Budapest, 2007. (Lecure notes in computer science 5152.) (Oldalszám: 7)
2007.
- Semi-supervised learning: a comparative study for web spam and telephone user churn
- Szerzők: Benczúr, András; Csalogány, Károly; Lukács, László; Siklósi, Dávid
Megjelenés: 2007.
Megjelent: ECML/PKDD 2007. 18th European conference on machine learning / 11th European conference on principles and practice of knowledge discovery in databases. Warsaw, 2007. (Oldalszám: 8)
- Spectral clustering in telephone call graphs
- Szerzők: Kurucz, Miklós; Benczúr, András; Csalogány, Károly; Lukács, László
Megjelenés: 2007.
Megjelent: WebKDD/SNAKDD 2007. Joint 9th WEBKDD and 1st SNA-KDD workshop '07. San José, 2007.
- Web spam detection via commercial intent analysis
- Szerzők: Benczúr, András; Bíró, István; Csalogány, Károly; Sarlós, Tamás
Megjelenés: 2007.
Megjelent: Airweb 2007. Banff, 2007.
- Who rated what: a combination of SVD, correlation and frequent sequence mining
- Szerzők: Kurucz, Miklós; Benczúr, András; Kiss, Tamas; Nagy, István II; Szabó, Adrienn; Torma, Balázs
Megjelenés: 2007.
Megjelent: KDDCup 2007. San José, 2007.
- Performing cross-language retrieval with wikipedia
- Szerzők: Schönhofen, Péter; Bíró, István; Benczúr, András; Csalogány, Károly
Szerkesztő: Nardi, A.; Peters, C.; Quochi, V.
Megjelenés: 2007.
Megjelent: CLEF 2007 workshop. Corss language system evaluation campaign. Budapest, 2007. (Oldalszám: 1)
- Overview of the imageCLEF 2007 object retrieval task
- Szerzők: Deselaers, Thomas; Hanbury, Allan; Viitaniemi, Ville; Benczúr, András; Brendel, Mátyás; Daróczy, Bálint Zoltán; Balderas, Hugo Jair Escalante; Gevers, Theo; Gracidas, Carlos Arturo Hernández; Hoi, Steven C. H.; Laaksonen, Jorma; Li, Mingjing; Castro, Heidy Marisol Marin; Ney, Hermann; Rui, Xiaoguang; Sebe, Nicu; Stöttinger, Julian; Wu, Lei
Szerkesztő: Nardi, A.; Peters, C.; Quochi, V.
Megjelenés: 2007.
Megjelent: CLEF 2007 workshop. Corss language system evaluation campaign. Budapest, 2007. (Oldalszám: 2)
- KDD Cup 2007 task 1 winner report
- Szerzők: Benczúr, András; Kurucz, Miklós; Kiss, Tamás; Nagy István, István II; Szabó, Adrienn; Torma, Balázs
Megjelenés: 2007.
Megjelent: KDD Cup 2007
- KDD cup 2007 task 1 winner report
- Szerzők: Kurucz, Miklós; Benczúr, András; Kiss, Tamás; Nagy István, István II; Szabó, Adrienn; Torma, Balázs
Megjelenés: 2007.
Megjelent: SIGKDD Explorations (Oldalszám: 5)
- Methods for large scale SVD with missing values
- Szerzők: Kurucz, Miklós; Benczúr, András; Csalogány, Károly
Megjelenés: 2007.
Megjelent: KDDCup 2007. San José, 2007.
- Cross-modal retrieval by text and image feature biclustering
- Szerzők: Benczúr, András; Bíró, István; Brendel, Mátyás; Csalogány, Károly; Daróczy, Bálint Zoltán; Siklósi, Dávid
Szerkesztő: Nardi, A.; Peters, C.; Quochi, V.
Megjelenés: 2007. 09.
Megjelent: CLEF 2007 workshop. Corss language system evaluation campaign. Budapest, 2007. (Oldalszám: 8)
2006.
- To randomize or not to randomize: space optimal summaries for hyperlink analysis
- Szerzők: Sarlós, Tamás; Benczúr, András; Csalogány, Károly; Fogaras, Dániel; Rácz, Balázs
Megjelenés: 2006.
Megjelent: WWW 2006. 15th international World Wide Web conference. Edinburgh, 2006. (Oldalszám: 2)
- Two-phase data warehouse optimized for data mining
- Szerzők: Rácz, Balázs; Sidló, Csaba István; Lukács, András; Benczúr, András
Szerkesztő: Busser, C; Catellanos, M; Navathe, S
Megjelenés: 2006.
Megjelent: VLDB 2006. First international workshop on business intelligence for the real time enterprise (BIRTE). Seoul, 2006. (Oldalszám: 6)
- PageRank és azon túl: Hiperhivatkozások szerepe a keresésben
- Szerzők: Benczúr, András; Bíró, István; Csalogány, Károly; Rácz, Balázs; Sarlós, Tamás
Megjelenés: 2006.
Megjelent: Magyar Tudomány (Oldalszám: 1)
- Link-based similarity search to fight web spam
- Szerzők: Benczúr, András; Csalogány, Károly; Sarlós, Tamás
Szerkesztő: Davison, BD; Najork, M; Converse, T
Megjelenés: 2006.
Megjelent: Airweb 2006. Proceedings of the 2nd international workshop on adversarial information retrieval on the web. Seattle, 2006. (Oldalszám: 9)
- Exploiting extremely rare features in text categorization
- Szerzők: Schönhofen, Péter; Benczúr, András
Megjelenés: 2006.
Megjelent: Lecture Notes in Artificial Intelligence (Oldalszám: 7)
- Detecting nepotistic links by language model disagreement
- Szerzők: Benczúr, András; Bíró, István; Csalogány, Károly; Uher, Máté
Megjelenés: 2006.
Megjelent: WWW 2006. 15th international World Wide Web conference. Edinburgh, 2006. (Oldalszám: 9)
2005.
- SpamRank - fully automatic link spam detection. Work in progress
- Szerzők: Benczúr, András; Csalogány, Károly; Sarlós, K.; Uher, M.
Megjelenés: 2005.
Megjelent: AIRWeb'05. First international workshop on adversarial information retrieval on the web. Chiba, 2005. (Oldalszám: 1)
- Primal-dual approach for directed vertex connectivity augmentation and generalizations
- Szerzők: Végh, LA; Benczúr, András
Megjelenés: 2005.
Megjelent: SODA 2005. Proceedings of the sixteenth annual ACM-SIAM symposium on discrete algorithms. Vancouver, 2005. (Oldalszám: 1)
- On the feasibility of low-rank approximation for personalized pagerank
- Szerzők: Benczúr, András; Csalogány, Károly; Sarlós, Tamás
Megjelenés: 2005.
Megjelent: WWW2005. 14th international World Wide Web conference. Chiba, 2005. (Oldalszám: 9)
- Feature selection based on word-sentence relation
- Szerzők: Schönhofen, Péter; Benczúr, András
Megjelenés: 2005.
Megjelent: ICMLA'05. 4th international conference on machine learning and applications. Proceedings. Los Angeles, 2005. (Oldalszám: 3)
2004.
- Magyar nyelvű tartalom a világhálón
- Szerzők: Benczúr, András; Csalogány, Károly; Fogaras, Dániel; Friedman, E.; Rácz, Balázs; Sarlós, Tamás; Uher, M.; Windhager, E.
Szerkesztő: Szeli, K
Megjelenés: 2004.
Megjelent: Információs társadalom internet információtechnika. (Kutatási jelentés 26) (Oldalszám: 4)
2003.
- Searching a small national domain - preliminary report
- Szerzők: Benczúr, András; Csalogány, Károly; Friedman, E.; Fogaras, Dániel; Sarlós, Tamás; Uher, M.
Megjelenés: 2003.
Megjelent: Proceedings of the twelfth international conference on World Wide Web, WWW2003. Budapest
- Pushdown-reduce: an algorithm for connectivity augmentation and poset covering problems
- Szerzők: Benczúr, András
Megjelenés: 2003.
Megjelent: DISCRETE APPLIED MATHEMATICS (Füzetszám: 2, Oldalszám: 2)
- Formal description of a distributed location service for mobile ad hoc networks
- Szerzők: Benczúr, András; Glasser, U.; Lukovszki, T.
Megjelenés: 2003.
Megjelent: LECTURE NOTES IN COMPUTER SCIENCE (Oldalszám: 2)
2002.
- Algebra and computation at SZTAKI
- Szerzők: Benczúr, András; Ivanyos, Gábor; Rónyai, Lajos
Megjelenés: 2002.
Megjelent: ERCIM NEWS (Oldalszám: 3)
2000.
- Fast algorithms for even/odd minimum cuts and generalizations
- Szerzők: Benczúr, András; Fülöp, O.
Szerkesztő: Paterson, M
Megjelenés: 2000.
Megjelent: Algorithms - ESA 2000. (Lecture notes in computer science 1879) (Oldalszám: 8)
- Augmenting undirected edge connectivity in Ő(n2) time
- Szerzők: Benczúr, András; Karger, DR
Megjelenés: 2000.
Megjelent: JOURNAL OF ALGORITHMS (Oldalszám: 2)
1999.
- Dilworth's theorem and its application for path systems of a cycle-implementation and analysis
- Szerzők: Benczúr, András; Förster, J.; Király, Z.
Szerkesztő: Nesetril, J
Megjelenés: 1999.
Megjelent: Algorithms - ESA '99. 7th annual European symposium. Prague, 1999. (Lecture notes in computer science, 1643.) (Oldalszám: 4)
- Covering symmetric supermodular functions by graphs
- Szerzők: Benczúr, András; Frank, A.
Megjelenés: 1999.
Megjelent: MATHEMATICAL PROGRAMMING (Oldalszám: 4)
1998.
- Augmenting undirected edge-connectivity in Ő(n2) time
- Szerzők: Benczúr, András; Karger, DR
Megjelenés: 1998.
Megjelent: Proceedings of the ninth annual ACM-SIAM symposium on discrete algorithms. San Francisco, 1998. (Oldalszám: 5)