Skip to main content

Ano ang Data Mining?

Ang Data Mining ay gumagamit ng medyo malaking halaga ng lakas ng computing na nagpapatakbo sa isang malaking hanay ng data upang matukoy ang mga regularidad at koneksyon sa pagitan ng mga puntos ng data.Ang mga algorithm na gumagamit ng mga pamamaraan mula sa mga istatistika, pag -aaral ng makina at pagkilala sa pattern ay ginagamit upang awtomatikong maghanap ng mga malalaking database.Ang pagmimina ng data ay kilala rin bilang pagtuklas ng kaalaman sa mga database (KDD). Tulad ng term na artipisyal na katalinuhan

, ang pagmimina ng data ay isang termino ng payong na maaaring mailapat sa isang iba't ibang mga aktibidad.Sa mundo ng korporasyon, ang pagmimina ng data ay madalas na ginagamit upang matukoy ang direksyon ng mga uso at hulaan ang hinaharap.Ginagamit ito upang makabuo ng mga modelo at mga sistema ng suporta sa desisyon na nagbibigay ng impormasyon sa mga tao na magagamit nila.Ang pagmimina ng data ay tumatagal ng isang papel na pang-linya sa labanan laban sa terorismo.Ito ay sinasabing ginamit upang matukoy ang pinuno ng 9/11 na pag-atake.

Ang mga minero ng data ay mga istatistika na gumagamit ng mga pamamaraan na may mga pangalan tulad ng malapit-kapit-bahay na mga modelo

,

k-means clustering , holdout method , k-foldAng pagpapatunay ng cross , ang leave-one-out na pamamaraan , at iba pa.Ang mga diskarte sa pagkadismaya ay ginagamit upang ibawas ang mga hindi nauugnay na mga pattern, nag -iiwan lamang ng kapaki -pakinabang na impormasyon.Ang salitang Bayesian ay madalas na nakikita sa larangan, na tumutukoy sa isang klase ng mga diskarte sa pagkilala na hinuhulaan ang posibilidad ng mga kaganapan sa hinaharap sa pamamagitan ng pagsasama ng mga naunang posibilidad at mga posibilidad batay sa mga kondisyon ng kondisyon.Ang pag -filter ng spam ay maaaring isang anyo ng pagmimina ng data, na awtomatikong nagdadala ng mga nauugnay na mensahe sa ibabaw mula sa isang magulong dagat ng mga pagtatangka sa phishing at mga pitches ng viagra.Sa isang puno ng desisyon, ang lahat ng data ay dumadaan sa isang node ng pasukan, kung saan nahaharap ito sa isang filter na naghihiwalay sa data sa mga sapa depende sa mga katangian nito.Halimbawa, ang data tungkol sa pag -uugali ng consumer ay malamang na mai -filter batay sa mga kadahilanan ng demograpiko.Ang pagmimina ng data ay hindi pangunahin tungkol sa magarbong mga graph at mga diskarte sa paggunita, ngunit ginagamit nito ang mga ito upang ipakita kung ano ang nahanap nito.Ito ay kilala na maaari nating sumipsip ng mas maraming impormasyon sa istatistika nang biswal kaysa sa pasalita at ang format na ito para sa pagtatanghal ay maaaring maging mapanghikayat at makapangyarihan kung ginamit sa tamang konteksto.mga kapaligiran, hindi namin sinasadyang matuklasan ang mga bagay na maaaring makaligtaan sa unang pass.Hahayaan tayo ng pagmimina ng data na iwasto ang mga pagkakamaling ito at matuklasan ang mga bagong pananaw batay sa nakaraang data, na nagbibigay sa amin ng mas maraming bang para sa aming data storage buck.