Was ist Sequenzabbau?

Sequence Mining ist eine Art strukturiertes Data Mining, in dem die Datenbank und der Administrator nach Sequenzen oder Trends in den Daten suchen. Dieser Data -Mining ist in zwei Felder aufgeteilt. Das ElementSet -Sequenzabbau wird typischerweise im Marketing verwendet, und die String -Sequenz -Mining wird in der biologischen Forschung verwendet. Das Sequenzmining unterscheidet sich vom regelmäßigen Trendabbau, da die Daten spezifischer sind, wodurch die Erstellung einer effektiven Datenbank für Datenbankdesigner schwierig ist. Manchmal kann es sich um schief sein, wenn sich die Sequenz von der gemeinsamen Sequenz unterscheidet. Dieser Bergbau hilft Unternehmen und Forschungsparteien, etwas zu finden, das sie brauchen. Normalerweise suchen sie nach einem Trend, aber was dieser Trend ist und wie spezifisch die Informationen sind, hängt vom Datenbankdesign ab. Im Sequenzabbau wurde die Datenbank erstellt, um sehr spezifische Sequenzen ohne Variation zu finden. Dies ist eine eindeutige Form des strukturierten Data Mining in WHICH Die Datenbank schaut durch die strukturierten Daten für Ähnlichkeiten.

Sequenzabbau kann in zwei Kategorien unterteilt werden. Der Elements -Mining wird im Marketing und im Geschäft verwendet, um spezifische Trends bei Verkaufszahlen, Produkttypen, Produktplatzierung in einem Geschäft und die Verwendung eines Produkts zu finden. Diese Zahlen werden auf Marketingalgorithmen genommen und angewendet, um ein Marketingprojekt zu strategieren und den Umsatz zu stärken. Informationen über ein Produkt und wie es typischerweise aus der Datenbank entnommen wird, aber der definierende Aspekt des Elementset-Sequenzabbaus besteht darin, dass die Sequenz aus Multi-Symbol-Datenbankzellen entnommen wird.

String -Mining ist das Gegenteil von Itemset Mining, da es jedes Symbol einzeln und nicht als Cluster betrachtet. Beim String -Mining könnte die Datenbank so eingestellt werden, dass eine Sequenz aus einer Proteinquelle oder einer Genproben ermittelt wird. Dies hilft beim Vergleich vieler Genproben, um festzustellen, ob sie gleich sind oderGroße Sequenzen aufschlüsseln und herausfinden, welche Sequenzen sie enthalten. Meistens verwenden biologische und medizinische Forschungsteams dies.

Erstellen einer Datenbank für das Sequenzabbau kann schwierig sein, da im Gegensatz zu Trendabbau und anderen strukturierten Data -Mining die Sequenzen spezifisch miteinander übereinstimmen müssen. Dies führt auch zum Problem des Bergbaus für Sequenzen. Wenn die Sequenz unterschiedlich ist, wird sie nicht erkannt, was den Elementset -Mining erschwert. Der String -Mining profitiert typischerweise davon, da der geringste Unterschied in einer Gewebeprobe den Organismus - oder was auch immer das Forschungsteam recherchiert - vollständig von anderen Stichproben unterscheidet.

ANDERE SPRACHEN

War dieser Artikel hilfreich? Danke für die Rückmeldung Danke für die Rückmeldung

Wie können wir helfen? Wie können wir helfen?