Skip to main content

Ano ang pinakamahalagang konsepto ng data sa pagmimina?

Ang pinakamahalagang konsepto ng pagmimina ng data ay ginagamit para sa pagsusuri ng nakolekta na impormasyon, lalo na sa pagsisikap na obserbahan ang isang pag -uugali.Ang hindi kilalang mga pakikipag -ugnayan sa pagitan ng data ay sinaliksik sa iba't ibang mga paraan upang matiyak ang mga kritikal na ugnayan sa pagitan ng mga paksa at pinagsama -samang impormasyon.Ang isang hamon sa pagmimina ng data ay ang aktwal na impormasyon na nakolekta ay maaaring hindi nakapagpapaalaala sa buong domain.Sa isang pagsisikap na matugunan ang katotohanang ito, ang mga ugnayan sa pagitan ng data ay maaaring makontrol ng iba't ibang mga konsepto ng pagmimina ng data.

Mga Pamantayan para sa Mga Konsepto ng Data ng Pagmimina ay ipinatutupad ng Association for Computing Makinarya Espesyal na Interes ng Interes sa Pagtuklas ng Kaalaman at Data Mining (SIGKDD).Inilathala ng samahan na ito ang "International Journal of Information Technology and Decision Making" pati na rin ang journal Sigkdd Explorations.Ang impormasyon ay isa sa pinakamahalagang aspeto ng pagmimina ng data.Ang hilaw na data ay dapat na mined at bigyang kahulugan.Upang maisagawa ang pagkilos na ito, dapat matukoy ang isang proseso, dapat na tipunin ang target na data at matatagpuan ang mga pattern.Ang proseso ay kilala bilang Kaalaman sa Pagtuklas sa Mga Databases

at binuo ni Gregory Piatetsky-Shapiro noong 1989.

Apat na magkakaibang klase ng mga konsepto ng pagmimina ng data ay nagpapahintulot sa proseso na maganap. Ang clustering

ay gumagamit ng algorithm na nilikha mula sa proseso ng pagmimina ng data upang mag -ipon ng mga item sa mga katulad na grupo.Hindi tulad ng clustering, ang pag -uuri ng

ng impormasyon ay kapag ang data ay natipon sa mga paunang natukoy na mga grupo at nasuri. Association Mga pagtatangka upang makahanap ng mga ugnayan sa pagitan ng mga variable, pagtukoy kung aling mga pangkat ng data ang karaniwang nauugnay.Ang pangwakas na uri ng pagmimina ng data ay regression , batay sa pamamaraan ng pagkilala ng isang function sa loob ng koleksyon ng data. Ang pagpapatunay ng impormasyon ay ang pangwakas na hakbang sa pagtuklas kung ano ang kinakatawan ng application ng pagmimina.Kapag hindi lahat ng mga algorithm ay nagtatanghal ng isang wastong set ng data, ang mga pattern na nagaganap ay maaaring magresulta sa isang sitwasyon na tinatawag na overfitting.Upang malampasan ang problemang ito, ang data ay inihambing sa isang set ng pagsubok.Ito ay isang konsepto kung saan ang mga sukat ay nakahanay sa isang serye ng mga algorithm na magbibigay ng isang maaaring mangyari na hanay ng mga set ng data.Kung ang nakuha na impormasyon ay hindi pumila sa set ng pagsubok, kung gayon ang ipinapalagay na mga pattern sa data ay dapat na hindi tumpak.

Ang ilan sa mga pinakamahalagang konsepto ng pagmimina ng data ay nangyayari sa iba't ibang mga industriya.Ang paglalaro, negosyo, marketing, agham, engineering at pagsubaybay ay gumagamit ng lahat ng mga diskarte sa pagmimina ng data.Sa pamamagitan ng pagsasagawa ng mga pamamaraan na ito, ang bawat patlang ay maaaring matukoy ang pinakamahusay na kasanayan o mas mahusay na mga paraan upang makahanap ng mga resulta.