Skip to main content

Ano ang iba't ibang mga pamamaraan ng pagmimina ng data?

Mayroong iba't ibang mga iba't ibang mga pamamaraan ng pagmimina ng data na ginamit sa parehong mga pagpipilian sa software at mga konsepto ng teoretikal.Pinapayagan nito ang mga gumagamit na kunin ang impormasyon mula sa data na nakolekta ng mga indibidwal at mga kumpanya na gumagamit ng iba't ibang mga tool.Ang malaking halaga ng data ay maaaring magamit upang matukoy ang iba't ibang mga kadahilanan sa isang solong paksa o iba't ibang mga paksa.Ang mga pamamaraan ng pagmimina ng data na ito ay kadalasang ginagamit sa larangan ng proteksyon ng pandaraya, marketing at pagsubaybay.

Sa daan -daang taon, ang mga pamamaraan ng pagmimina ng data ay ginamit upang kunin ang impormasyon mula sa mga paksa.Ang mga modernong pamamaraan, gayunpaman, gumamit ng mga awtomatikong konsepto upang magbigay ng malaking data sa pamamagitan ng mga computer na mapagkukunan.Habang lumitaw ang mga agham sa computer noong ika -20 siglo, ang konsepto ng mga pamamaraan ng pagmimina ng data na binuo sa isang pagsisikap na malampasan ang mga nakatagong pattern sa malalaking swath ng nakolekta na data.Ang isang mabuting halimbawa nito ay kapag ang isang firm ng advertising na nagsusuri ng mga pattern ng pamimili ng isang online na customer.Ang kumpanyang ito ay maaaring mag -market ng ilang mga produkto na maaaring maging interesado ang indibidwal sa pagbili.

Ang isang diskarte sa pagmimina ng data na ginagamit nang karaniwang sa industriya ay tinatawag na Kaalaman sa Pagtuklas sa mga database (KDD).Binuo noong 1989 ni Gregory Piatetsky-Shapiro, pinapayagan ng KDD ang mga gumagamit na iproseso ang hilaw na data, pag-aralan ang impormasyon para sa mga kinakailangang data at bigyang kahulugan ang mga resulta.Ang pamamaraang ito ay nagbibigay -daan sa mga gumagamit na makahanap ng mga pattern sa mga algorithm, gayunpaman, ang pangkalahatang data ay hindi palaging tumpak at maaaring magkasama sa mga paraan ng pagkompromiso.Ito ay kilala bilang overfitting .

Pag -uuri

Kinukuha ang impormasyon na naroroon at pinagsama ito sa tinukoy na mga pangkat. Clustering Tinatanggal ang tinukoy na mga pangkat at pinapayagan ang data na maiuri ang sarili sa pamamagitan ng mga katulad na item. Ang regression ay nakatuon sa pag -andar ng impormasyon, pagmomolde ng data sa konsepto.Ang pangwakas na paraan ng pagmimina ng data, Association , ay nagtatangkang makahanap ng mga ugnayan sa pagitan ng iba't ibang mga feed ng data. Kapag ginagamit ang iba't ibang mga pamamaraan ng pagmimina ng data, ang ilang mga pamantayan ay ginagamit upang matukoy kung aling mga parameter ang maaaring magamit sa proseso.Ang Association for Computing Machinerys Special Interest Group on Knowledge Discovery and Data Mining (SIGKDD) ay humahawak ng isang taunang pulong na tumutukoy kung aling mga proseso ang naaangkop.Ang mga etikal na kadahilanan ay tinimbang kasama ang mga praktikal na aplikasyon upang mahanap ang pinakamahusay na impormasyon tungkol sa mga indibidwal at kumpanya.Ang impormasyong ito ay nai -publish sa isang journal ng industriya na tinatawag na

Sigkdd Explorations.