Ugrás a tartalomhoz

EU Kiválósági KözpontISO 9001

ERCIMW3C MemberFraunhofer Projektközpont

LiWA

Teljes név: LiWA
Részleg: Adatbányászat és Keresőtechnológiák Kutatócsoport
Kezdési időpont: 2008. 02. 01.
Befejezési időpont: 2011. 01. 31.
Külső azonosító: FP7-216267
Költségvetés: 3.624.871 euro

Projekt vezető

Benczúr András
Benczúr András
Cím: 1111 Budapest, Lágymányosi u. 11.
Szoba: L 412
Telefon: +36 1 279 6172
Fax: +36 1 209 5269
E-mail: benczurEZT_TOROLJE_KI@EZT_TOROLJE_KIsztaki.mta.hu
Honlap: http://datamining.sztaki.hu/

Tevékenység

A LiWA: Enrichment tools for Web archive projekt célja a Web tartalom archiválását „élővé” tenni.
A Web tartalom a tudásalapú társadalom növekvő fontosságú pillére. A Web tartalom hosszú távú megőrzése szolgálhat tudományos vagy piackutatási célokat, szerzői jogvitában dönthet, stb. A tartalom megőrzése iránt növekvő igényt mutatnak mind a könyvtárak, mind az archiváló szervezetek, mind a kialakulóban levő piacorientált szolgáltatások. A Web tartalom bizonyos sajátosságai, gyors dinamikája, illékonysága, formátum és szolgáltatás variánsai nagy kihívást jelentenek a megőrzés, archiválás területén.
A LiWA projekt keretében átlépjük a „fagyasztott” pillanatkép megőrzésének kereteit, és a pillanatfelvételek megőrzésén túl olyan „élő” Web archívumot kívánunk létrehozni, amely
1. hosszú távú interoperabilitást valósít meg az archívumok fejlődése mellett;
2. tiszta minőségű, lényegtelen „zajtól” mentes információt tartalmaz;
3. formátumok széles választékát öleli fel.
Célunk túllépni a state-of-the-art megoldásokon és létrehozni a Web tartalom begyűjtését, megőrzését, vizsgálatát és strukturális gazdagítását biztosító új generációs megoldást. Célunk az archívum tisztaságának biztosítása, a magas minőségű tartalom összegyűjtése, és a hosszú távú interoperabilitás megőrzése.
A projekt fókuszában olyan innovatív megoldások állnak, amelyek a tartalom gyűjtését, a spam és egyéb zajtól való megtisztítását, a pillanatfelvételek időbeli koherenciáját, a szemantika és terminológia változásának követését biztosítják. A kifejlesztett eszközök két minta alkalmazásban hasznosulnak, egy audiovizuális médiafolyam és egy társasági média archívumban, amelyeken keresztül az archiválás iparában érdekeltek számára az eredmények elérhetővé válnak.

A LiWA: Enrichment tools for Web archive projektben az MTA SZTAKI szerepe a Web spam szűréssel kapcsolatos Work Package vezetése, illetve szövegbányászati feladatokban veszünk részt. Részvételünket a Web spam szűréssel, a képi és szöveges keresőrendszerekkel kapcsolatos kutatásaink alapozták meg. Európai szintű siker, hogy résztvevői vagyunk az FP7 Digital Libraries első felhívás 9 támogatást nyert STREP pályázata közül kettőnek.