Skip to main content

Co je těžba datových toků?

Těžba datových toků je strategie, která zahrnuje identifikaci a extrahování informací z aktivního datového proudu.Tímto přístupem je myšlenkou vytáhnout data bez vytvoření jakéhokoli typu přerušení v samotném proudu, což ostatním umožňuje také využívat data, i když k extrakci dochází.Tento typ úsilí o těžbu datových toků může zahrnovat nejrůznější dat, od hlasu po přenos videa přes internet a dokonce až po každodenní úkoly, jako je odebrání peněz z bankovního účtu pomocí automatizovaného pokladního počítače nebo pořádání telefonní konverzace.

Jednou z charakteristik těžby datových toků je schopnost přesně promítat nebo předvídat, jak najít požadované informace a jaký typ nástrojů pro zjišťování znalostí pomůže při lokalizaci a úspěšném extrahování požadovaných informací.Například, když zákazník iniciuje transakci pomocí automatizovaného pokladního počítače, programování pro stroj iniciuje vyhledávání příslušných informací o účtu, vyhledá data a poté určí, zda částka transakce sníží zůstatek účtu pod přípustnou částkou,Na základě způsobu, jakým je účet strukturován.Odtud může programování vrátit uživateli relevantní data, jako je dokumentace úspěšného dokončení požadované transakce a zajištění zůstatek účtu po zaznamenání úvěru nebo debetu spojeného s transakcí.

Dalším běžným příkladem těžby datových toků je základní vyhledávání na webu pomocí prohlížeče.S touto aplikací koncový uživatel zadá do pole vyhledávací hodnoty a software, který řídí prohlížeč, se snaží interpretovat tyto hodnoty a vrátit data, která mají určitý význam pro kritéria vyhledávání.V závislosti na tom, jak je prohlížeč nakonfigurován, může to také zahrnovat funkci, která se snaží předvídat záměr prováděného vyhledávání a nabídnout další slova nebo fráze, která mohou pomoci vyhledávání více podle vkusu uživatele.Jakmile se uživatel usadí na vyhledávací frázi, prohlížeč vrátí výsledky podle hodnocení pomocí algoritmů, které jsou relevantní pro konfiguraci samotného prohlížeče.

Jednou z hlavních výhod těžby datových toků je schopnost přístupu a vyhledávání dat, aniž by ve skutečnosti zakazoval ostatním využívání stejných dat.Protože datové toky se neustále aktualizují, mohou se výsledky extrakce čas od času měnit.Například provedení vyhledávání na webu pomocí konkrétní vyhledávací fráze může dnes přinést jednu sadu výsledků, ale zítra poskytnout mírně odlišnou sadu výsledků na základě toho, jaké nové informace vstoupily do datového proudu a jak se vyhledávač řadí.