Skip to main content

Was ist Data Mining?

Data Mining verwendet eine relativ große Menge an Rechenleistung, die auf einem großen Datensatz arbeitet, um Regelmäßigkeiten und Verbindungen zwischen Datenpunkten zu bestimmen.Algorithmen, die Techniken aus Statistiken, maschinellem Lernen und Mustererkennung anwenden, werden verwendet, um große Datenbanken automatisch zu durchsuchen.Data Mining wird auch als Wissensentwicklung in Datenbanken (KDD) bezeichnet.In der Unternehmenswelt wird das Data Mining am häufigsten verwendet, um die Richtung der Trends zu bestimmen und die Zukunft vorherzusagen.Es wird verwendet, um Modelle und Entscheidungsunterstützungssysteme zu erstellen, die den Menschen Informationen geben, die sie verwenden können.Data Mining spielt im Kampf gegen den Terrorismus eine vordere Rolle.Es wurde angeblich verwendet, um den Anführer der 9/11-Angriffe zu bestimmen.Quervalidierung

, die

Leave-One-Out-Methode usw.Regressionstechniken werden verwendet, um irrelevante Muster zu subtrahieren und nur nützliche Informationen zu hinterlassen.Der Begriff Bayesian

ist häufig vor Ort zu sehen, was sich auf eine Klasse von Inferenztechniken bezieht, die die Wahrscheinlichkeit künftiger Ereignisse vorhersagen, indem frühere Wahrscheinlichkeiten und Wahrscheinlichkeiten auf der Grundlage bedingter Ereignisse kombiniert werden.Die Spam -Filterung ist wohl eine Form des Data Mining, die automatisch relevante Nachrichten von einem chaotischen Meer von Phishing -Versuchen und Viagra -Stellplätzen auf die Oberfläche bringt.In einem Entscheidungsbaum werden alle Daten durch einen Eingangsknoten geleitet, wo es einem Filter gegenübersteht, der die Daten in Abhängigkeit von seinen Eigenschaften in Streams auftret.Beispielsweise werden Daten über das Verbraucherverhalten wahrscheinlich anhand der demografischen Faktoren gefiltert.Bei Data Mining geht es nicht hauptsächlich um ausgefallene Graphen und Visualisierungstechniken, sondern um sie, um zu zeigen, was es gefunden hat.Es ist bekannt, dass wir statistische Informationen visuell als verbal absorbieren können, und dieses Format für die Präsentation kann sehr überzeugend und leistungsfähig sein, wenn sie im richtigen Kontext verwendet werden.Umgebungen, wir werden versehentlich Dinge entdecken, die beim ersten Pass übersehen werden könnten.Durch Data Mining können wir diese Fehler korrigieren und neue Erkenntnisse basierend auf früheren Daten ermitteln, wodurch wir mehr für unser Datenspeicherbock geknallt werden.