Skip to main content

Co je to těžba prostorových dat?

Dolování prostorových dat je proces pokusu o nalezení vzorů v geografických datech.Nejčastěji se používají v maloobchodě, vyrostla z oblasti těžby dat, která se původně zaměřila na hledání vzorců v textových a numerických elektronických informacích.Dolování prostorových dat je považováno za složitější výzvu než tradiční těžba kvůli obtížím spojeným s analýzou objektů s konkrétními existencemi v prostoru a čase.Je to technika pro rozhodování o tom, kde otevřít, jaký druh obchodu.Může pomoci informovat tato rozhodnutí zpracováním již existujících údajů o tom, jaké faktory motivují spotřebitele k tomu, aby šli na jedno místo a ne jiné.Pokud by měla přístup k příslušným údajům, mohla by použít těžbu prostorových dat, aby zjistila, jaké prostorové faktory činí noční kluby úspěšnými.Mohla by se ptát jako: přijde do klubu více lidí, pokud je poblíž veřejná doprava?Jakou vzdálenost od jiných míst nočního života maximalizuje patronáž?Je blízkost plynových stanic Plus nebo mínus?Mohla také použít těžbu prostorových dat mdash; možná přesněji, Spatiotemporální těžba dat a MDASH; zjistit, jak se lidé v určitých časech pohybují městem.Stejný proces lze použít na sponzorství v různých nocích v týdnu.

Obtížnost dolování prostorových dat jsou výsledkem složitosti světa za internetem.Zatímco minulé úsilí o těžbu dat obvykle mělo databáze zralé pro analýzu, vstupy dostupné pro dolování prostorových dat nejsou mřížky informací, ale mapy.Tyto mapy mají různé typy objektů, jako jsou silnice, populace, podniky atd.

Stanovení, zda je něco blízkého něčemu jinému, jde z diskrétního k nepřetržité proměnné.To masivně zvyšuje složitost potřebnou pro analýzu.Je neuvěřitelné, že se jedná o jeden z jednodušších typů vztahů, které mají dostupné, aby se někdo pokusil o těžbu prostorových dat.

Dolování prostorových dat čelí také problému falešných pozitiv.V procesu vyhledávání dat hledající vztahy se v důsledku statistických falešných pozitiv objeví mnoho zjevných trendů.Tento problém také existuje pro úlohu těžby jednodušší databáze, ale je zesílena velikostí dat dostupných pro horního horníka.Nakonec by měl být trend identifikovaný dolováním prostorových dat potvrzen procesem vysvětlení a dalšího výzkumu.