Skip to main content

Hva er struktur gruvedrift?

Struktur gruvedrift er en type data mining der en semistrukturert datakilde skannes, og elementer i dens struktur blir oppdaget og fremhevet.En semistrukturert datakilde er en som ikke bruker den tradisjonelle databasestrukturen til tabeller, men har et semantisk element som skiller informasjon via tagger og markører.Struktur gruvedrift kan brukes til å gruve databaser, nettsteder og mange andre former for datamaskininformasjon for å oppdage elementer i strukturen.Det hjelper brukere enten å forstå hvordan brikker samhandler med hverandre eller hvordan du finner informasjon under visse tagger.Denne gruvedriften kan også brukes til å forutsi hva et element er, basert på regler skrevet av brukeren.

Det er mange forskjellige typer data mining, og de fleste er opptatt av å gruve en tradisjonelt strukturert kilde.Dette inkluderer enhver kilde som bruker tabellene og noder som er typiske for de fleste databaser.I struktur gruvedrift brukes bare semistrukturerte data.I dette tilfellet er dataene fra nettsteder eller enkle databaser som har en struktur, men ikke en som samsvarer med tradisjonelle databaseregler.Dataene trenger tagger eller markører som skiller hvert element for å bli utvunnet riktig.

Ved å lese det semistrukturerte datasettet, er struktur gruvedrift i stand til å oppdage hvordan strukturen samhandler.For eksempel har hvert nettsted en navigasjonsmodell, og det er denne modellen som avgjør hvordan sidene samhandler.Ved å gruve strukturen kan brukeren oppdage hvordan denne navigasjonen fungerer, noe som kan bidra til å lage et lignende navigasjonsskjema.

For eksempel, hvis det er et bokdatasett, kan brukeren skrive en regel om at bøker uten indeks skal returnere som fiksjon, og de med en indeks skal returnere som sakprosa.De fleste skjønnlitterære bøker mangler en indeks, så denne regelen vil forutsi med høy nøyaktighet hva dataene er.Dette hjelper brukere når de ser på et semistrukturert sett som har en organisasjonsmetode, men ikke en som passer til det brukeren leter etter. Etter å ha funnet ut strukturen til den semistrukturerte enheten, vil brukeren vanligvis sammenligne den med en annenSemistrukturert enhet.Hvis brukeren har en bedriftsnettsted, kan han eller hun gruve en annen bedriftsnettsted for navigasjon og lenker, og se hvordan nettstedet hans er likt.Ved å sammenligne utvinnet informasjon, kan brukeren finne måter å øke strukturens effektivitet.