Skip to main content

Ano ang pagkuha ng impormasyon?

Minsan kilala bilang Information Retrieval, Information Extraction (IE) ay isang proseso na ginagamit sa mga computer system upang payagan ang mga nauugnay na data na makuha mula sa mas malalaking katawan ng data, gamit ang ilang hanay ng mga paunang natukoy na pamantayan.Ang ideya sa likod ng pagkuha ng impormasyon ay upang maging posible upang madaling matukoy at mai -assimilate ang data na may kaugnayan sa isang partikular na aktibidad, nang hindi nangangailangan ng manu -manong dumaan sa maraming impormasyon upang mahanap ang eksaktong data na kinakailangan.Ang proseso ay katulad ng mga ideya ng konsepto ng pagmimina o pag -scrape ng web, na ang lahat ng mga pamamaraang ito ay naghahangad na mangolekta ng kapaki -pakinabang na impormasyon mula sa isang mas malawak na pool ng magagamit na data.

Ang pangkalahatang diskarte sa mga tawag sa pagkuha ng impormasyon para sa paggamit ng programming na may kakayahang mag-scan ng mga mapagkukunan ng impormasyon na itinuturing na nababasa ng makina.Maaari itong isama ang mga hard copy na dokumento na na -scan sa ilang uri ng mga elektronikong file, mga dokumento na inihanda bilang mga spreadsheet o mga dokumento sa pagproseso ng salita, o kahit na ang data na nakapaloob sa mga nababasa na patlang sa isang database.Karaniwan, ang mga parameter ay nakatakda na posible para sa isang programa ng software na bibigyan ng access sa mga mapagkukunang data na ito at mabilis na mai -scan sa pamamagitan ng mga ito gamit ang mga tiyak na pamantayan upang unahin at hilahin ang ilang mga uri ng impormasyon mula sa magagamit na pool.Ang prosesong ito ay karaniwang naiiba mula sa isang simpleng proseso ng paghahanap, na ang pamamaraan ay tumatawag para sa hindi pagtutugma ng mga tiyak na salita o parirala bawat se, ngunit sa halip ay gumagamit ng isang proseso na tinatawag na natural na pagproseso ng wika, na tumutulong sa hindi lamang pagsusuri ng aktwal na mga salita kundi pati na rin ang konteksto atAng kahulugan na ipinahiwatig ng kontekstong iyon.

Ang pagiging kumplikado na kasangkot sa pagkuha ng impormasyon ay ginagawang mahirap ang paggamit ng pamamaraang ito upang pamahalaan sa isang pandaigdigang sukat, bagaman mayroong mga tool ng IE na gumagana nang maayos lamang sa isang limitadong halaga ng data, tulad ng mga mapagkukunan ng data na nauugnay sa mga elektronikong fileNakalagay sa server ng isang korporasyon, o kahit isang pool ng mga mapagkukunan na kinasasangkutan ng isang limitadong bilang ng mga feed ng balita.Sa pamamaraang ito posible na makilala ang ilang uri ng kaganapan, marahil kahit na limitahan ang pagbabalik sa pagsasama ng isang tiyak na bilang ng mga kalahok sa kaganapan, at isinaayos ang data ayon sa petsa.

Tulad ng maraming mga form ng teknolohiya, ang mga tool na ginamit upang makisali sa pagkuha ng impormasyon ay patuloy na pinino.Dahil sa simula ng ika-21 siglo, ang kakayahang magtakda ng mga parameter at gumamit ng patuloy na pagtaas ng mga katawan ng elektronikong data bilang bahagi ng paghahanap para sa may-katuturang impormasyon ay tumaas nang malaki.Kasama dito ang kakayahang makitungo sa malalaking dami ng hindi nakaayos na data at gamitin ang mga parameter na iyon upang magdala ng ilang order o istraktura sa data na iyon, ginagawa itong lahat na mas kapaki -pakinabang para sa mga paghahanap sa hinaharap.