Skip to main content

Ano ang correlation clustering?

Ang kumpol ng correlation ay isinasagawa sa mga database at iba pang malalaking mapagkukunan ng data upang magkasama magkasama magkatulad na mga datasets, habang inaalerto din ang gumagamit sa mga hindi magkakatulad na mga datasets.Maaari itong gawin nang perpekto sa ilang mga graph, habang ang iba ay makakaranas ng mga pagkakamali dahil mahirap na makilala ang katulad mula sa hindi magkakatulad na data.Sa kaso ng huli, ang correlation clustering ay makakatulong na mabawasan ang error nang awtomatiko.Madalas itong ginagamit para sa pagmimina ng data, o upang maghanap ng hindi magagawang data para sa pagkakapareho.Ang mga hindi kanais -nais na data ay karaniwang tinanggal, o inilalagay sa isang hiwalay na kumpol.Sasabihin ng gumagamit sa programa kung ano ang hahanapin at, kapag ito ay natagpuan, kung saan ilalagay ang data.Ito ay karaniwang inilalapat sa napakalaking mapagkukunan ng data kung kailan ito imposible at mdash;O kumuha ng masyadong maraming oras at mdash;Upang maghanap nang manu -mano ang data.Maaaring magkaroon ng alinman sa perpektong kumpol o hindi sakdal na kumpol.

Ang perpektong kumpol ay ang perpektong senaryo.Nangangahulugan ito na may dalawang uri lamang ng data, at ang isa ay kung ano ang hinahanap ng gumagamit habang ang iba ay hindi kinakailangang.Ang lahat ng mga positibo, o kinakailangan, ang data ay inilalagay sa isang kumpol, habang ang iba pang data ay tinanggal o inilipat.Sa sitwasyong ito, walang pagkalito at lahat ay gumagana nang perpekto.

Ang karamihan sa mga kumplikadong mga graph ay hindi pinapayagan ang perpektong kumpol, at sa halip, hindi perpekto.Halimbawa, ang isang graph ay may tatlong variable: x, y at z. x, y ay magkatulad, x, z ay magkatulad, ngunit y, z ay hindi magkakatulad.Ang tatlong variable na kumpol ay magkatulad, gayunpaman, imposible na magkaroon ng perpektong kumpol ng ugnayan.Ang programa ay gagana upang ma -maximize ang bilang ng mga positibong ugnayan, ngunit kakailanganin pa rin nito ang ilang manu -manong paghahanap mula sa gumagamit.Halimbawa, kung ang isang data na minahan ng negosyo para sa isang malaking website o database at nais lamang na malaman ang tungkol sa isang tiyak na aspeto, aabutin magpakailanman upang maghanap sa lahat ng data para sa aspeto na iyon.Sa pamamagitan ng paggamit ng isang pormula ng kumpol, ang data ay itatakda para sa wastong pagsusuri.Ang gumagamit ay maaaring pumili upang magpadala ng magkakaibang data sa iba't ibang mga kumpol, dahil ang impormasyon ay maaaring maging kapaki -pakinabang para sa iba pang mga proyekto.Kung ang data ay hindi kinakailangang at nag -aaksaya lamang ng memorya, kung gayon ang hindi magkakatulad na impormasyon ay itinapon.Sa di -sakdal na kumpol, posible na ang ilang hindi magkakatulad na impormasyon ay hindi itatapon, sapagkat ito ay katulad ng data na tinitingnan ng gumagamit.