Skip to main content

Co to jest wydobycie danych?

Wydobycie danych wykorzystuje stosunkowo dużą moc obliczeniową działającą na dużym zestawie danych w celu ustalenia prawidłowości i połączeń między punktami danych.Algorytmy wykorzystujące techniki z statystyki, uczenia maszynowego i rozpoznawania wzorów są używane do automatycznego wyszukiwania dużych baz danych.Wydobycie danych jest również znane jako odkrycie wiedzy w bazach danych (KDD).

Podobnie jak termin sztuczna inteligencja , wydobycie danych jest terminem parasolowym, który można zastosować do wielu różnych działań.W świecie korporacyjnym wydobycie danych jest najczęściej wykorzystywane do określenia kierunku trendów i przewidywania przyszłości.Jest stosowany do budowania modeli i systemów wsparcia decyzji, które udzielają informacji, z których mogą korzystać.Wydobycie danych odgrywa rolę pierwszej linii w bitwie z terroryzmem.Podobno użyto go do określenia lidera ataków z 11 września.

Górnicy danych to statystycy, którzy używają technik o nazwach takich jak Modele w pobliżu Neighbor , K-MANS CLUSTING , METODA ZATRZYMANIA , K-FOLDWalidacja krzyżowa , metoda wyjścia i tak dalej.Techniki regresji stosuje się do odejmowania nieistotnych wzorców, pozostawiając tylko przydatne informacje.Termin Bayesian jest często widoczny w terenie, odnosząc się do klasy technik wnioskowania, które przewidują prawdopodobieństwo przyszłych zdarzeń, łącząc wcześniejsze prawdopodobieństwa i prawdopodobieństwa oparte na zdarzeniach warunkowych.Filtrowanie spamu jest prawdopodobnie formą eksploracji danych, która automatycznie wprowadza na powierzchnię odpowiednie komunikaty z chaotycznego morza prób phishingowych i wysokich wysokości.

Drzewa decyzyjne służą do filtrowania gór danych.W drzewie decyzyjnym wszystkie dane przechodzą przez węzeł wejściowy, w którym stoją w obliczu filtra, który oddziela dane na strumienie w zależności od jego właściwości.Na przykład dane o zachowaniu konsumentów mogą zostać przefiltrowane na podstawie czynników demograficznych.Wydobycie danych nie dotyczy przede wszystkim fantazyjnych wykresów i technik wizualizacji, ale wykorzystuje je do pokazania, co znalazł.Wiadomo, że możemy wchłonąć więcej informacji statystycznych wizualnie niż werbalnie, a ten format prezentacji może być bardzo przekonujący i potężny, jeśli jest używany w odpowiednim kontekście.

Ponieważ nasza cywilizacja staje się coraz bardziej nasycona danymi, a czujniki są masowo rozmieszczane na nasz lokalny lokalny lokalny lokalnyŚrodowiska, nieumyślnie odkrymy rzeczy, które można przegapić podczas pierwszego przepustki.Wydobycie danych pozwoli nam poprawić te błędy i odkryć nowe spostrzeżenia w oparciu o wcześniejsze dane, co daje nam więcej huku dla naszego złotówki dla przechowywania danych.