Ugrás a tartalomhoz

EU Kiválósági KözpontISO 9001

ERCIMW3C MemberFraunhofer Projektközpont

Adatrosta / Data Riddle

Adatrosta / Data Riddle
Teljes név: Adatrosta - webtárházak nagytömegű adatbázisainak elemzése adatbányászati és statisztikai eszközök segítségével
Részleg: Adatbányászat és Keresőtechnológiák Kutatócsoport
Kezdési időpont: 2002. 11. 01.
Befejezési időpont: 2005. 05. 31.
Külső azonosító: NKFP-2/0017/2002

Projekt vezető

Benczúr András
Benczúr András
Cím: 1111 Budapest, Lágymányosi u. 11.
Szoba: L 412
Telefon: +36 1 279 6172
Fax: +36 1 209 5269
E-mail: benczurEZT_TOROLJE_KI@EZT_TOROLJE_KIsztaki.mta.hu
Honlap: http://datamining.sztaki.hu/

András Lukács

Résztvevők

ELTE, BME, MTA SZTAKI, T-Online (Axelero), econet.hu

Tevékenység

A digitális gazdaság nagy ígérete, hogy az ügyfeleket jellemző fogyasztói magatartásokról információk gazdag tárháza áll rendelkezésre, amely alapjául szolgál a korábbi lehetőségekhez képest jóval alaposabb, pontosabb és hatékonyabb tervezésnek, ill. fejlesztésnek. A weben megjelenő cégek és szervezetek számára az ügyfélismeret lehetőségét az üzemeltetés során keletkező forgalmi naplóállományok elemzése adja meg.

Az Internet szolgáltatók látogatottsági statisztikáiban például napszaki, heti, vagy évszakos sajátságokat fedezhetünk fel, illetve észlelhetjük a szokatlan eseményeket, a hirtelen forgalombővülést vagy -kiesést. Ennél azonban az elemzés jóval tovább is léphet: a személyiségi jogok védelmét, az anonimitását biztosító azonosítók használatával megismerhető az egyes felhasználó, számára így személyre szabott szolgáltatás biztosítható. Nem kell tehát fölösleges információdzsungelen áthaladnia, egy portál vagy e-kereskedő egyéni érdeklődési köre szerint automatikusan hozhat létre számára weboldalakat.

A projekt számára a legnagyobb kihívást az jelentette, hogy egy országos méretet elérő Internet szolgáltatónál akkora napi elemzendő adatmennyiség keletkezik, amelyet a meglevő elemző szoftverek már képtelenek feldolgozni. Az elemzést olyan eljárásokra kell alapozni, amelyek az adatbázis mindössze egy-kétszeri végigolvasásával igen összetett kérdésekre tudnak válaszolni. Ezen módszereket a milliárdos adatmennyiségekre szakosodott adatbányászat fejlődő tudományága biztosítja.