Skip to main content

Ano ang isang pag -uuri ng data ng pagmimina?

Ang pag -uuri ng data ng pagmimina ay isang hakbang sa proseso ng pagmimina ng data.Ginagamit ito sa mga item ng pangkat batay sa ilang mga pangunahing katangian.Mayroong maraming mga pamamaraan na ginamit para sa pag -uuri ng data ng pagmimina, kabilang ang pinakamalapit na pag -uuri ng kapitbahay, pag -aaral ng puno ng desisyon, at suporta sa mga makina ng vector.

Ang pagmimina ng data ay isang pamamaraan na ginagamit ng mga mananaliksik upang kunin ang mga pattern mula sa data.Karaniwan ang isang kinatawan na sample ay pinili mula sa pool ng data at pagkatapos ay manipulahin at nasuri upang makahanap ng mga pattern.Bilang karagdagan sa pag -uuri ng data ng pagmimina, ang mga mananaliksik ay maaari ring gumamit ng kumpol, regression, at pag -aaral ng panuntunan upang pag -aralan ang data.

Mayroong maraming mga algorithm na maaaring magamit sa pag -uuri ng data ng pagmimina.Ang pinakamalapit na pag -uuri ng kapitbahay ay isa sa pinakasimpleng mga algorithm ng pag -uuri ng data ng pagmimina.Nakasalalay ito sa isang set ng pagsasanay.Ang isang set ng pagsasanay ay isang hanay ng data na ginamit upang sanayin ang computer upang bigyang -pansin ang ilang mga variable.Sa pinakamalapit na pag -uuri ng kapitbahay, inuri lamang ng computer ang lahat ng data bilang bahagi ng pangkat na naglalaman ng data na pinakamalapit sa halaga sa input.Ang computer ay karaniwang nagtatanong ng isang serye ng mga katanungan tungkol sa data.Kung ang sagot sa unang tanong ay totoo, nagtatanong ito ng Tanong 2A.Kung ang sagot ay hindi totoo, nagtatanong ito ng Tanong 2B.Kapag iginuhit, ang pamamaraang ito ay bumubuo ng isang puno ng mga landas na sumasanga.Nagtatanong ito ng isang serye ng mga katanungan tungkol sa bawat piraso ng data at pagkatapos ay gumagamit ng mga sagot upang matukoy ang posibilidad na ang data ay kabilang sa isang partikular na pag -uuri.Ito ay naiiba sa pag -aaral ng puno ng desisyon dahil ang sagot sa unang tanong ay hindi nakakaimpluwensya kung aling tanong ang tatanungin sa susunod.Ang mga pamamaraan na ito ay mga modelo na batay sa computer na magiging mahirap gawin sa pamamagitan ng kamay.Ang mga Neural Networks ay madalas na ginagamit sa artipisyal na programming ng katalinuhan dahil ginagaya nito ang utak ng tao.Sinasala nito ang impormasyon sa pamamagitan ng isang serye ng mga node na nakakahanap ng mga pattern at pagkatapos ay pag -uri -uriin ang impormasyon.Kapag ang mga bagong impormasyon ay pinakain sa makina, naka -plot ito sa graph.Ang data ay pagkatapos ay inuri batay sa kung aling kategorya ang impormasyon ay bumagsak sa graph.Ang pamamaraang ito ay gumagana lamang kapag mayroong dalawang mga pagpipilian na pipiliin.