Skip to main content

Vad är rumslig data mining?

Rumlig data mining är processen att försöka hitta mönster i geografiska data.Det oftast används i detaljhandeln har den vuxit ut från området för data mining, som ursprungligen fokuserade på att hitta mönster i textuell och numerisk elektronisk information.Rumslig data mining anses vara en mer komplicerad utmaning än traditionell gruvdrift på grund av svårigheterna med att analysera objekt med konkreta existenser i rum och tid.

Som med standarddatabrytning används rumslig databrytning främst i världen av marknadsföring och detaljhandel.Det är en teknik för att fatta beslut om var man ska öppna vilken typ av butik.Det kan hjälpa till att informera dessa beslut genom att bearbeta befintliga uppgifter om vilka faktorer som motiverar konsumenterna att gå till ett ställe och inte ett annat.

Säg att Ashley vill öppna en nattklubb på ett visst stadsblock.Om hon hade tillgång till lämpliga uppgifter, kunde hon använda rumslig data mining för att ta reda på vilka rumsliga faktorer som gör nattklubbar framgångsrika.Hon kanske ställer frågor som: Kommer fler människor att komma till klubben om kollektivtrafiken är i närheten?Vilket avstånd från andra nattlivsplatser maximerar beskydd?Är närhet till bensinstationer ett plus eller en minus?

Ashley kanske också vill se till att de människor som kommer till hennes nattklubb kommer i en jämn distribution under en individuell natt.Hon kunde också använda rumslig data mining mdash; kanske mer exakt, spatiotemporal data mining mdash; för att ta reda på hur människor rör sig genom staden vid vissa tider.Samma process kan tillämpas på beskydd på olika nätter i veckan.

Svårigheterna med den rumsliga data mining är ett resultat av världens komplexitet bortom internet.Medan tidigare ansträngningar för data mining vanligtvis hade databaser mogna för analys, är de ingångar som finns tillgängliga för rumslig data mining inte rutnät utan kartor.Dessa kartor har olika typer av föremål som vägar, befolkningar, företag och så vidare.

Att bestämma om något är nära något annat går från att vara en diskret till en kontinuerlig variabel.Detta ökar massivt komplexiteten som krävs för analys.Otroligt, detta är en av de enklare typerna av relationer som finns tillgängliga för någon som försöker rumslig data mining.

Rumlig data mining står också inför problemet med falska positiver.I processen med att söka data som letar efter relationer kommer många uppenbara trender att dyka upp som en följd av statistiska falska positiva effekter.Detta problem finns också för uppgiften att bryta en enklare databas, men det förstärks av storleken på data som finns tillgängliga för den rumsliga data gruvarbetaren.I slutändan bör en trend identifierad genom rumslig data mining bekräftas genom förklaringsprocessen och ytterligare forskning.