Skip to main content

Mi az adatbányászat?

Az adatbányászat viszonylag nagy mennyiségű számítástechnikai teljesítményt használ, amely nagy adatkészleten működik, hogy meghatározza az adatpontok közötti szabályszerűségeket és kapcsolatokat.A statisztikák, a gépi tanulás és a mintafelismerés technikáit alkalmazó algoritmusokat használják a nagy adatbázisok automatikus keresésére.Az adatbányászatot az adatbázisokban (KDD) tudás-felfedezésnek is nevezik.A vállalati világban az adatbányászatot leggyakrabban használják a trendek irányának meghatározására és a jövő előrejelzésére.Olyan modellek és döntéshozatali rendszerek felépítésére szolgál, amelyek információkat adnak az embereknek, amelyeket felhasználhatnak.Az adatbányászat frontvonal szerepet játszik a terrorizmus elleni küzdelemben.Állítólag a szeptember 11-i támadások vezetőjének meghatározására használták fel.

Az adatbányászok olyan statisztikusok, akik olyan technikákat alkalmaznak, amelyek olyan nevekkel foglalkoznak, mint közel a szomszédos modellek ,

K-Means Clustering

, Holdout módszer , K-szerkesztésKereszt validálás , a kilépési módszer és így tovább.A regressziós technikákat használják az irreleváns minták kivonására, csak hasznos információkat hagyva.A Bayes -féle kifejezést gyakran látják a területen, utalva a következtetési technikák osztályára, amelyek előrejelzik a jövőbeli események valószínűségét azáltal, hogy kombinálják a feltételes eseményeken alapuló korábbi valószínűségeket és valószínűségeket.A spamszűrés vitathatatlanul az adatbányászat egyik formája, amely automatikusan a releváns üzeneteket hozza a felszínre az adathalászkísérletek és a viagra pályák kaotikus tengeréből.Egy döntési fában az összes adat áthalad egy bejárati csomóponton, ahol olyan szűrővel néz szembe, amely jellemzőitől függően az adatokat patakokba osztja.Például a fogyasztói viselkedésre vonatkozó adatokat valószínűleg a demográfiai tényezők alapján szűrik.Az adatbányászat nem elsősorban a képzeletbeli grafikonokra és a megjelenítési technikákra vonatkozik, hanem felhasználja azokat, hogy megmutassa, mit talált.Ismert, hogy a statisztikai információkat vizuálisan is szóban tudjuk elnyelni, és ez a prezentáció formátuma nagyon meggyőző és erőteljes lehet, ha a megfelelő kontextusban használják.Környezetek, véletlenül felfedezzük azokat a dolgokat, amelyek hiányozhatnak az első áthaladás során.Az adatbányászat lehetővé teszi, hogy kijavítsuk ezeket a hibákat, és új betekintést fedezzünk fel a múltbeli adatok alapján, és még több robbantást ad nekünk az adattárolási dollárhoz.