Skip to main content

Wat is sequentiemining?

Sequention mining is een type gestructureerde datamining waarin de database en beheerder op zoek zijn naar sequenties of trends in de gegevens.Deze datamining is opgesplitst in twee velden.Itemset -sequentiemining wordt meestal gebruikt in marketing en stringsequentiemining wordt gebruikt in biologieonderzoek.Sequentiemining verschilt van de reguliere trend mining, omdat de gegevens specifieker zijn, waardoor het bouwen van een effectieve database moeilijk is voor databaseontwerpers, en het kan soms mis gaan als de reeks anders is dan de gemeenschappelijke volgorde.

Op een bepaald punt ofEen andere, alle databases worden gebruikt om te mijnen voor gegevens.Deze mijnbouw helpt bedrijven en onderzoekspartijen iets te vinden dat ze nodig hebben.Meestal zijn ze op zoek naar een soort trend, maar wat die trend is en hoe specifiek de informatie is, hangt af van het databaseontwerp.In sequentiemining is de database gebouwd om zeer specifieke sequenties te vinden, met weinig tot geen variatie.Dit is een unieke vorm van gestructureerde datamining waarin de database de gestructureerde gegevens voor overeenkomsten doorkijkt.

-sequentiemining kan worden onderverdeeld in twee categorieën.Itemset -mining wordt gebruikt in marketing en bedrijven om specifieke trends te vinden in verkoopnummers, producttypen, productplaatsing in een winkel en het gebruik van een product.Deze cijfers worden genomen en toegepast op marketingalgoritmen om een marketingproject te helpen strategiseren en de verkoop te versterken.Informatie over een product en hoe het meestal wordt gehaald uit de database, maar het bepalende aspect van itemset-sequentiemining is dat de sequentie is afkomstig van multi-symboldatabasecellen.

String mining is het tegenovergestelde van itemset mining omdat het kijkt naarelk symbool afzonderlijk in plaats van als een cluster.In string mining kan de database worden ingesteld om een sequentie te vinden uit een eiwitbron of genmonsters.Dit helpt bij het vergelijken van veel genmonsters om te zien of ze hetzelfde zijn of om grote sequenties af te breken en te vinden welke sequenties ze bevatten.Meestal gebruiken biologische en medische onderzoeksteams dit.

Het maken van een database voor sequentiemining kan moeilijk zijn omdat, in tegenstelling tot trend mining en andere gestructureerde datamining, de sequenties specifiek moeten overeenkomen met elkaar.Dit leidt ook tot het probleem van mijnbouw voor sequenties.Als de volgorde anders is, wordt deze niet herkend, waardoor de mijnbouw moeilijker kan worden.Stringwinning profiteert meestal hiervan, omdat het minste verschil in een weefselmonster het organisme mdash zou kunnen maken;Of wat het onderzoeksteam ook onderzoekt mdash;volledig verschillend van andere monsters.