Adatminőség javítás és adatintegráció

 
 

Minden vállalat, szervezet működéséhez elengedhetetlen a folyamatait jó minőségben leíró adat előállítása és használata, ahol az adatminőség javítása többszörösen megtérül. Ehhez viszont szerkezetében és tartalmában heterogén, hiányos, hibás forrásadatok egységesítésén, javításán és feldolgozásán keresztül vezet az út.

Adattisztító megoldásaink nyílt szabványú, újrafelhasználható transzformációs műveletekre épülnek: a valódi érték az itt leképzett üzleti, iparági tudásban rejlik. Gyorsan személyre szabható tartalommal rendelkezünk ügyféladatokra (nevek, postai címek, telefonszámok stb.) és log adatokra (applikációs  és web szerver logok).  Lehetőségünk van külső adatok, például címtörzsek, cégadatbázisok, térkép koordináták vagy akár közösségi hálók adatainak csatolására. Transzformációs készleteink folyamatos fejlődése mellett új adatkörök feldolgozási lépései is gyorsan kialakíthatók.

Adatbázisainkban a valós dolgok sokszor duplikálva, több lenyomattal is jelen vannak. Ilyen esetekben alapvető kérdéseket is nehéz megválaszolni: „Hány ügyfelünk, termékünk, felhasználónk van valójában?” Ahhoz, hogy valós képet alkothassunk a folyamatainkról elengedhetetlen az egyezések felderítése. Aktív kutatási tevékenységünk eredményein alapuló módszereink az elterjedt megoldásokhoz képest nagyságrendekkel több adatra alkalmazhatók olyan bonyolult esetekben is, mint például a háztartások azonosítása.

Módszereinkkel és eszközeinkkel gyorsan és költséghatékonyan tervezünk és implementálunk megbízható és robusztus adatintegráló folyamatokat. Kutatási eredményeinkre építve rendelkezünk alkalmazásokkal ügyfél-, log-, szenzor- és web adatokra, visszaélés-felderítés, IT security, okos város, trendelemzés és hálózatelemzés témakörökben.

Az egyre nagyobb ütemben növekvő adatmennyiségek, a „Big Data”, a valósidejűség elvárása komoly kihívást jelentenek. Ezt szem előtt tartva megoldásaink jól tervezhető és költséghatékony módon szétoszthatók

  • több processzormagra gépen belül, több gépes környezetekre, felhőbe, Hadoop-ra kötegelt feldolgozáshoz,
  • Strom-ra vagy in-memory adatbázisokra valós idejű feldolgozáshoz.

Azonosságfeloldás, deduplikáció

Követelmények

bármilyen adatforrásból érkező, az adott entitás megjelenéseit tartalmazó adathalmazok (adatbázis táblák, file-ok, web stb.)

Eredmény megnevezése
összevont rekord-halmazok, amik a valós entitásokhoz tartoznak – pl. valós személyek mentén létrehozott ügyfélrekord halmazok
Eredmény technikai leírása

Adatbázisainkban a valós dolgok sokszor duplikálva, több lenyomattal is jelen vannak. Ilyen esetekben alapvető kérdéseket is nehéz megválaszolni: „Hány ügyfelünk, termékünk, felhasználónk van valójában?” Ahhoz, hogy valós képet alkothassunk a folyamatainkról elengedhetetlen az egyezések felderítése. Aktív kutatási tevékenységünk eredményein alapuló módszereink az elterjedt megoldásokhoz képest nagyságrendekkel több adatra alkalmazhatók olyan bonyolult esetekben is, mint például a háztartások azonosítása.

Hossza
feladatfüggő, de két hónapnál kisebb projekt nehezen képzelhető el
Árazása
adathalmaz méretétől, minőségétől, a kitűzött céloktól függ
Célcsoportja
Jellemzően ügyfél-adatbázisok tulajdonosai, ahol sok folyamat épül CRM rendszerekre, ahol gondot okoz marketing adatbázisok ügyféladatbázisokhoz kapcsolása és felhasználása. Hasonló problémák előfordulnak nagy méretű termék-adatbázisokon, de bármilyen entitás okozhat gondot (webes dokumentumok, regisztrációk, gépjárművek, lakások, könyvek, cikkek stb.)

Adatminőség javítás és adatintegráció

Követelmények

bármilyen adattisztítást igénylő adathalmaz, bármilyen formátumban – például ügyféladatbázisok, marketing címtörzsek, webshopok termékleírásai, webes dokumentumok stb.

Eredmény megnevezése
szabványosított, hibáktól szűrt és javított adathalmaz, a hibák egyértelmű megjelölésével
Eredmény technikai leírása

Az adatminőség javítása többszörösen megtérül, amihez viszont szerkezetében és tartalmában heterogén, hiányos, hibás forrásadatok egységesítésén, javításán és feldolgozásán keresztül vezet az út.

Adattisztító megoldásaink nyílt szabványú, újrafelhasználható transzformációs műveletekre épülnek: a valódi érték az itt leképzett üzleti, iparági tudásban rejlik. Gyorsan személyre szabható tartalommal rendelkezünk ügyféladatokra (nevek, postai címek, telefonszámok stb.) és log adatokra (applikációs  és web szerver logok).  Lehetőségünk van külső adatok, például címtörzsek, cégadatbázisok, térkép koordináták vagy akár közösségi hálók adatainak csatolására. Transzformációs készleteink folyamatos fejlődése mellett új adatkörök feldolgozási lépései is gyorsan kialakíthatók.

Hossza
feladatfüggő, de két hónapnál kisebb projekt nehezen képzelhető el
Árazása
adathalmaz méretétől, minőségétől, a kitűzött céloktól függ
Célcsoportja
- döntéstámogatási rendszerek bármilyen szervezetben, ahol heterogén adatforrások adatait kell importálni; pl. pénzügyi szolgáltatók, telekom szolgáltatók,
- automatikusan generált log- és szenzor adatok felhasználói, pl. telekom cégek, webes szolgáltatók