Adatminőség javítás és adatintegráció

 
 

Minden vállalat, szervezet működéséhez elengedhetetlen a folyamatait jó minőségben leíró adat előállítása és használata, ahol az adatminőség javítása többszörösen megtérül. Ehhez viszont szerkezetében és tartalmában heterogén, hiányos, hibás forrásadatok egységesítésén, javításán és feldolgozásán keresztül vezet az út.

Adattisztító megoldásaink nyílt szabványú, újrafelhasználható transzformációs műveletekre épülnek: a valódi érték az itt leképzett üzleti, iparági tudásban rejlik. Gyorsan személyre szabható tartalommal rendelkezünk ügyféladatokra (nevek, postai címek, telefonszámok stb.) és log adatokra (applikációs  és web szerver logok).  Lehetőségünk van külső adatok, például címtörzsek, cégadatbázisok, térkép koordináták vagy akár közösségi hálók adatainak csatolására. Transzformációs készleteink folyamatos fejlődése mellett új adatkörök feldolgozási lépései is gyorsan kialakíthatók.

Adatbázisainkban a valós dolgok sokszor duplikálva, több lenyomattal is jelen vannak. Ilyen esetekben alapvető kérdéseket is nehéz megválaszolni: „Hány ügyfelünk, termékünk, felhasználónk van valójában?” Ahhoz, hogy valós képet alkothassunk a folyamatainkról elengedhetetlen az egyezések felderítése. Aktív kutatási tevékenységünk eredményein alapuló módszereink az elterjedt megoldásokhoz képest nagyságrendekkel több adatra alkalmazhatók olyan bonyolult esetekben is, mint például a háztartások azonosítása.

Módszereinkkel és eszközeinkkel gyorsan és költséghatékonyan tervezünk és implementálunk megbízható és robusztus adatintegráló folyamatokat. Kutatási eredményeinkre építve rendelkezünk alkalmazásokkal ügyfél-, log-, szenzor- és web adatokra, visszaélés-felderítés, IT security, okos város, trendelemzés és hálózatelemzés témakörökben.

Az egyre nagyobb ütemben növekvő adatmennyiségek, a „Big Data”, a valósidejűség elvárása komoly kihívást jelentenek. Ezt szem előtt tartva megoldásaink jól tervezhető és költséghatékony módon szétoszthatók

  • több processzormagra gépen belül, több gépes környezetekre, felhőbe, Hadoop-ra kötegelt feldolgozáshoz,
  • Strom-ra vagy in-memory adatbázisokra valós idejű feldolgozáshoz.