Skip to main content

Vad är strukturbrytning?

Strukturbrytning är en typ av databrytning där en semistrukturerad datakälla skannas och element i dess struktur upptäcks och markeras.En semistrukturerad datakälla är en som inte använder den traditionella databasstrukturen i tabellerna, men har ett semantiskt element som skiljer information via taggar och markörer.Strukturbrytning kan användas för att gruva databaser, webbplatser och många andra former av datorinformation för att upptäcka element i strukturen.Det hjälper användare att antingen förstå hur delar interagerar med varandra eller hur man hittar information under vissa taggar.Denna gruvdrift kan också användas för att förutsäga vad ett objekt är, baserat på regler skriven av användaren.

Det finns många olika typer av databrytning, och de flesta handlar om att bryta en traditionellt strukturerad källa.Detta inkluderar alla källor som använder tabeller och noder som är typiska för de flesta databaser.Vid strukturbrytning används endast semistrukturerade data.I det här fallet kommer uppgifterna från webbplatser eller enkla databaser som har en struktur men inte en som överensstämmer med traditionella databasregler.Data behöver taggar eller markörer som skiljer varje objekt för att vara korrekt bryts.

Genom att läsa den semistrukturerade datauppsättningen kan strukturbrytning upptäcka hur strukturen interagerar.Till exempel har varje webbplats en navigationsmodell, och det är denna modell som avgör hur sidorna interagerar.Genom att bryta strukturen kan användaren upptäcka hur denna navigering fungerar, vilket kan hjälpa till att skapa ett liknande navigeringsschema.

Struktur gruvdrift också kan användas för att hitta objekt genom att skriva regler i gruvprogrammet.Om det till exempel finns en bokdatauppsättning kan användaren skriva en regel om att alla böcker utan index ska återvända som fiktion, och de med ett index bör återvända som facklitteratur.De flesta fiktionböcker saknar ett index, så denna regel förutsäger med hög noggrannhet vad uppgifterna är.Detta hjälper användare när de tittar på en semistrukturerad uppsättning som har en organisatorisk metod men inte en som passar vad användaren letar efter.

Efter att ha räknat ut strukturen för den semistrukturerade enheten kommer användaren vanligtvis att jämföra den med en annanHalvstrukturerad enhet.Om användaren har en affärswebbplats kan han eller hon bryta en annan affärswebbplats för navigering och länkar och se hur hans eller hennes webbplats liknar.Genom att jämföra den brytade informationen kan användaren hitta sätt att öka strukturens effektivitet.