Was ist eine Data Mining -Klassifizierung?
Die Klassifizierung von Data Mining ist ein Schritt im Prozess des Data Mining.Es wird verwendet, um Elemente basierend auf bestimmten Schlüsselmerkmalen zu gruppieren.Für die Klassifizierung von Data Mining werden verschiedene Techniken verwendet, einschließlich der Klassifizierung des nächsten Nachbarn, Entscheidungsbaumlernen und Support -Vektormaschinen.
Data Mining ist eine Methode, die Forscher verwenden, um Muster aus Daten zu extrahieren.Im Allgemeinen wird eine repräsentative Probe aus dem Datenpool ausgewählt und dann manipuliert und analysiert, um Muster zu finden.Zusätzlich zur Klassifizierung von Data Mining können Forscher auch Clustering, Regression und Regellernen zur Analyse der Daten verwenden.
Es gibt mehrere Algorithmen, die in der Klassifizierung von Data Mining verwendet werden können.Die Klassifizierung der nächsten Nachbarn ist eine der einfachsten der Data Mining -Klassifizierungsalgorithmen.Es stützt sich auf ein Trainingssatz.Ein Trainingssatz ist eine Reihe von Daten, mit denen der Computer auf bestimmte Variablen geachtet wird.In der nächstgelegenen Nachbarklassifizierung klassifiziert der Computer einfach alle Daten als Teil der Gruppe, die Daten enthält, die im Wert der Eingabe am nächsten stehen.
Entscheidungsbaum -Lernen verwendet ein Verzweigungsmodell, um die Daten zu klassifizieren.Der Computer stellt im Grunde eine Reihe von Fragen zu den Daten.Wenn die Antwort auf die erste Frage wahr ist, stellt sie Frage 2a.Wenn die Antwort falsch ist, stellt sie Frage 2B.Wenn diese Methode herausgezogen wird, bildet diese Methode einen Baum mit Verzweigungspfaden.
naive Bayes -Klassifizierung beruht auf der Wahrscheinlichkeit.Es wird eine Reihe von Fragen zu jedem Datenstück gestellt und dann die Antworten verwendet, um die Wahrscheinlichkeit zu bestimmen, dass die Daten in eine bestimmte Klassifizierung gehören.Dies unterscheidet sich vom Lernen von Entscheidungsbaumern, da die Antwort auf die erste Frage keinen Einfluss auf die nächste Frage beeinflusst.Diese Methoden sind computergestützte Modelle, die von Hand schwierig zu tun sind.Neuronale Netze werden häufig in der Programmierung künstlicher Intelligenz eingesetzt, da es das menschliche Gehirn nachahmt.Es filtert Informationen über eine Reihe von Knoten, die Muster finden, und klassifizieren dann die Informationen.
Unterstützung Vektorautomaten verwenden Schulungsmuster, um ein Modell zu erstellen, das Informationen klassifiziert, die normalerweise als Streudiagramm mit einem breiten Raum zwischen Kategorien visualisiert werden.Wenn neue Informationen in die Maschine eingespeist werden, wird sie in der Grafik aufgezeichnet.Die Daten werden dann basierend auf der Kategorie klassifiziert, in der die Informationen in der Grafik am nächsten stehen.Diese Methode funktioniert nur, wenn zwei Optionen zur Auswahl stehen.