Skip to main content

Was ist Strukturabbau?

Strukturabbau ist eine Art von Data Mining, bei der eine semi-strukturierte Datenquelle gescannt und Elemente ihrer Struktur entdeckt und hervorgehoben werden.Eine semi-strukturierte Datenquelle ist eine, die nicht die herkömmliche Datenbankstruktur von Tabellen verwendet, sondern über ein semantisches Element verfügt, das Informationen über Tags und Markierungen trennt.Das Strukturabbau kann verwendet werden, um Datenbanken, Websites und viele andere Formen von Computerinformationen zu ermitteln, um Elemente der Struktur zu entdecken.Es hilft Benutzern, entweder zu verstehen, wie Teile miteinander interagieren oder wie sie unter bestimmten Tags Informationen finden.Dieser Mining kann auch verwendet werden, um vorherzusagen, was ein Element auf der Grundlage des vom Benutzer verfassten Regeln ist.

Es gibt viele verschiedene Arten von Data Mining, und die meisten sind mit dem Abbau einer traditionell strukturierten Quelle.Dies umfasst jede Quelle, die die für die meisten Datenbanken typischen Tabellen und Knoten verwendet.Im Strukturabbau werden nur semi-strukturierte Daten verwendet.In diesem Fall stammen die Daten von Websites oder einfachen Datenbanken, die eine Struktur haben, aber nicht aus der traditionellen Datenbankregeln entspricht.Die Daten benötigen Tags oder Markierungen, die jedes Element so festlegen, dass sie ordnungsgemäß abgebaut werden.

Durch das Lesen des semi-strukturierten Datensatzes kann der Strukturmining feststellen, wie die Struktur interagiert.Beispielsweise verfügt jede Website über ein Navigationsmodell, und dieses Modell bestimmt, wie die Seiten interagieren.Durch das Mining der Struktur kann der Benutzer herausfinden, wie diese Navigation funktioniert, was dazu beitragen kann, ein ähnliches Navigationsschema zu erstellen.Wenn es beispielsweise einen Buchdatensatz gibt, kann der Benutzer eine Regel schreiben, die Bücher ohne Index als Fiktion zurückgeben und diejenigen mit einem Index als Sachbuch zurückgeben sollten.In den meisten Fiktionsbüchern fehlt ein Index, daher wird diese Regel mit hoher Genauigkeit vorhersagen, was die Daten sind.Dies hilft den Benutzern bei der Betrachtung eines semi-strukturierten Satzes, das eine Organisationsmethode hat, jedoch nicht eine, die dem zu dem passt, wonach der Benutzer sucht.

Nachdem der Benutzer die Struktur der semi-strukturierten Einheit herausgefunden hatHalbstrukturierte Einheit.Wenn der Benutzer eine Business -Website hat, kann er oder sie eine andere Geschäftswebsite für Navigation und Links abbauen und sehen, wie seine Website ähnlich ist.Durch den Vergleich der abgebauten Informationen kann der Benutzer Wege finden, um die Effizienz der Struktur zu erhöhen.