Internet

Ano ang data deduplication?

Ang data deduplication ay isang pamamaraan para sa pag -compress ng data kung saan tinanggal ang duplicate data, pinapanatili ang isang kopya ng bawat yunit ng impormasyon sa isang system sa halip na payagan ang mga multiple na umunlad.Ang mga kopya na napanatili ay may mga sanggunian na nagpapahintulot sa system na makuha ang mga ito.Ang pamamaraan na ito ay binabawasan ang pangangailangan para sa espasyo ng imbakan at maaaring mapanatili ang mga system na tumatakbo nang mas mabilis bilang karagdagan sa paglilimita sa mga gastos na nauugnay sa pag -iimbak ng data.Maaari itong gumana sa isang bilang ng mga paraan at ginagamit sa maraming uri ng mga computer system.

Sa deduplication ng data-level na data, ang system ay naghahanap para sa anumang mga dobleng file at tinatanggal ang mga extra.Ang block-level deduplication ay tumitingin sa mga bloke ng data sa loob ng mga file upang makilala ang extraneous data.Ang mga tao ay maaaring magtapos sa dobleng data para sa isang iba't ibang mga kadahilanan, at ang paggamit ng data deduplication ay maaaring mag -streamline ng isang sistema, na ginagawang mas madaling gamitin.Ang system ay maaaring pana-panahong pag-pore sa pamamagitan ng data upang suriin para sa mga duplicate, alisin ang mga extra, at makabuo ng mga sanggunian para sa mga file na naiwan.Ang parehong mga termino ay sumangguni sa ideya na ang system ay gumagana nang matalinong upang mag -imbak at mag -file ng data upang mabawasan ang pag -load sa system.Ang data deduplication ay maaaring maging mahalaga lalo na sa mga malalaking sistema kung saan ang data mula sa isang bilang ng mga mapagkukunan ay naka -imbak at ang mga gastos sa imbakan ay patuloy na tumataas, dahil ang system ay kailangang mapalawak sa paglipas ng panahon.

Ang mga sistemang ito ay idinisenyo upang maging bahagi ng isang mas malaking sistemapara sa pag -compress at pamamahala ng data.Ang data deduplication ay hindi maaaring maprotektahan ang mga sistema mula sakagamitan, at iba pa.Ang pagkakaroon ng data na naka -compress bago mag -back up ay makatipid ng oras at pera.

Ang mga system na gumagamit ng data deduplication sa kanilang imbakan ay maaaring tumakbo nang mas mabilis at mahusay.Mangangailangan pa rin sila ng pana -panahong pagpapalawak upang mapaunlakan ang mga bagong data at upang matugunan ang mga alalahanin tungkol sa seguridad, ngunit dapat silang hindi gaanong madaling kapitan ng pagpuno nang mabilis sa mga dobleng data.Ito ay isang pangkaraniwang pag -aalala sa mga server ng email, kung saan ang server ay maaaring mag -imbak ng malaking halaga ng data para sa mga gumagamit at makabuluhang mga chunks nito ay maaaring binubuo ng mga duplicate tulad ng parehong mga kalakip na paulit -ulit;Halimbawa, maraming mga tao na nag -email mula sa trabaho ang nakakabit ng mga footer na may mga disclaimer ng email at mga logo ng kumpanya, at ang mga ito ay maaaring kumain ng puwang ng server nang mabilis.