Skip to main content

Mi az a szerkezeti bányászat?

A szerkezetbányászat egy olyan típusú adatbányászat, amelyben a félig strukturált adatforrást beolvassák, és felépítik és kiemelik annak felépítését.A félig strukturált adatforrás olyan, amely nem használja a táblázatok hagyományos adatbázis-struktúráját, de van egy szemantikai elem, amely az információkat a címkéken és a markereken keresztül választja el.A szerkezetbányászat felhasználható az adatbázisok, webhelyek és sok más számítógépes információ bányászatához a szerkezet elemeinek felfedezéséhez.Segít a felhasználóknak megérteni, hogy a darabok hogyan lépnek kapcsolatba egymással, vagy hogyan lehet információkat találni bizonyos címkék alatt.Ez a bányászat arra is felhasználható, hogy megjósolja, mi az elem, a felhasználó által írt szabályok alapján.Ez magában foglalja minden olyan forrást, amely a legtöbb adatbázisra jellemző táblákat és csomópontokat használja.A szerkezetbányászatban csak félig strukturált adatokat használnak.Ebben az esetben az adatok olyan webhelyekből vagy egyszerű adatbázisokból származnak, amelyeknek struktúrája van, de nem olyan, amely megfelel a hagyományos adatbázis -szabályoknak.Az adatoknak olyan címkékre vagy markerekre van szükségük, amelyek az egyes elemeket elkülönítik a megfelelő bányászathoz.Például minden weboldalnak van navigációs modellje, és ez a modell határozza meg, hogy az oldalak hogyan működnek együtt.A struktúra bányászásával a felhasználó felfedezheti, hogyan működik ez a navigáció, amely elősegítheti a hasonló navigációs séma létrehozását.Például, ha van egy könyves adatkészlet, akkor a felhasználó olyan szabályt írhat, hogy minden index nélküli könyvnek fikcióként kell visszatérnie, és az indextel rendelkező személyeknek nem-fantasztikusként kell visszatérniük.A legtöbb fikciós könyvnek nincs indexe, tehát ez a szabály nagy pontossággal megjósolja, mi az adatok.Ez segíti a felhasználókat, ha egy félig strukturált készletet vizsgál, amelynek szervezeti módszere van, de nem olyan, amely megfelel a felhasználó számára.félig strukturált egység.Ha a felhasználónak van üzleti weboldala, akkor egy másik üzleti weboldalt bányászhat a navigációra és a linkekre, és megnézheti, hogy a webhelye hogyan hasonlít.A bányászott információk összehasonlításával a felhasználó megtalálhatja a struktúra hatékonyságának növelésének módját.