Elosztott Tudásgráfok

 
2020. szep. 23. – 2024. szep. 22.
 

A kutatói vagy ipari kapcsolatok és információk megosztásának és összekapcsolásának legfontosabb eszközeivé váltak a tudásgráfok, melyek rugalmas módon, elosztott rendszerként működve teszik lehetővé az adatok elérését, felhasználását és közzétételét. 

A tudásgráf technológiák iránti igény növekedésével olyan új kihívásokra kell megoldást találni, mint a tudásgráfok egyre nagyobb méretének kezelése, az abban foglalt adatok minőségének folyamatos biztosítása, valamint az érzékeny adatok védelme.

A 2020. őszén elindult Elosztott Tudásgráfok (Distributed Knowledge Graphs - DKG) EU COST projekt fő célja olyan tudásgráf technológiák létrehozása, melyek webes szabványokon alapulnak, teljesítik a FAIR követelményeket, nyíltak, biztosítják az adatok védelmét és lehetővé teszik a magas minőségű adatok decentralizált közzétételét.

A projektben a SZTAKI Elosztott Rendszerek Osztálya (DSD) vesz részt, a korábbi linked data és szemantikus web kutatásokra építve az elosztott tudásgráfok alkalmazástechnológiájával, valamint a tudásgráf alapú webszolgálatok kialakításával foglalkozik.

DKG áttekintés

A projekt munkacsoportokra (WG) van felosztva a tudásgráf rendszerek tipikus részrendszerei alapján:

  • A Szolgáltatók Munkacsoport a skálázható, privátszférát tisztelő ugyanakkor FAIR tudásgráfok kialakításának és működtetésének szenteli kutatási tevékenységét.
  • A Fogyasztók Munkacsoport azt kutatja, hogyan lehet nagyszámú tudásgráf forrás alapján integrált feldolgozásokat, lekérdezéseket elvégezni.
  • A Szolgáltató-Fogyasztó Munkacsoport témaköre azon komplex folyamatok vizsgálata, melyek egyszerre töltik be a fogyasztó és szolgáltató szerepköröket, például tudásgráfokból szintetizált tudást injektálnak tudásgráfokba. 
  • A Rendszerek Munkacsoport foglalkozik azon innovációkkal, melyek a tudásgráf rendszer komponenseivel kapcsolatosak, például újfajta felhasználói felületekkel.

A gráf alapú adatmodell megkönnyíti a különböző forrásokból származó adatok kombinálását, mivel az adatmodell előre definiált séma nélkül dolgozik. A saját adatok jelentősen feljavíthatók külső forrásokkal való kombinációval, amely például nagyban segíti például az analitikát. Az elosztott architektúrára viszont azért van szükség, mert egyrészt nehéz nagy adatmennyiségeket egyetlen helyen tárolni, másrészt a közzétételnél a decentralizált megközelítés a legkedvezőbb, amikor az adatok központi szereplő bevonása nélkül is szolgáltathatók.

Mióta a tudásgráf technológiák alkalmazása felívelőben van, új kihívások fogalmazódnak meg egy ténylegesen funkcionáló elosztott, FAIR tudásgráf ökoszisztéma kialakításának érdekében. Itt a Szemantikus Web és a Kapcsolt Adatok használatának az lenne a szerepe, hogy összekösse a különbözőképpen strukturált adatokat a Weben. Ezek az elvárások alapkutatást igényelnek tudásgráfok elosztottságának fokát és méretét, valamint az adatminőség megfigyelését, mérését és fenntartását illetően. 

A technológia terjedését a projekt azzal is támogatja, hogy jó gyakorlatokat fogalmaz meg a közzétételre és a feldolgozásra nézve az elosztott tudásgráfokra vonatkozóan. Mindezen kutatási kérdések a tudományos közösség erősebb együttműködését igénylik, hogy megvalósulhasson egy jobban működő, decentralizált “adatweb”. Ennek lehet egyik elősegítője a DKG projekt. 

 

Résztvevők

Vienna University of Economics and Business

Ghent University

National University of Ireland Galway

University of Malta

Maastricht University

Friedrich-Alexander University Erlangen-Nuremberg

École des Mines de Saint-Étienne

Linköping University

Academy of Sciences, Albania

Aalborg University, Denmark

imec, Belgium

Burgas Free University, Bulgaria

University of Tuzla, Bosnia and Herzegovina

University of Zagreb, Croatia

Tallinn University of Technology, Estonia

FORTH - Hellas, Greece

Aristotle University of Thessaloniki, Greece

SZTAKI, Hungary

Reykjavik University, Iceland

Dublin City University, Ireland

Technion City, Israel

Jerusalem College of Technology, Israel

University of Salerno, Italy

Italian National Research Council

University of Latvia

University of Luxembourg

VU University Amsterdam, the Netherlands

SINTEF AS, Norway

Norwegian University of Science and Technology

Instytut Informatyki Gospodarczej sp. z o.o., Poland

ANACOM, Portugal

Universidade de Lisboa, Portugal

University Politehnica of Bucharest, Romania

Technical University of Cluj-Napoca, Romania

Institute Mihajlo Pupin, Serbia

Technical University of Kosice, Slovakia

InnoRenew CoE, Slovenia

Everyware Technologies, Spain

Universidad de Málaga, Spain

University of Applied Sciences and Arts Western Switzerland

Universität St.Gallen, Switzerland

Sabanci University, Turkey

University of Strathclyde, UK

Részleg