Skip to main content

Hvad er videnekstraktion?

Videnekstraktion er processen med at bruge forskellige informationskilder til at skabe en sammenhængende videnbank.Som en del af denne tilgang vil ekstraktionen ofte trække på en række af både strukturerede og ustrukturerede kilder.Når den er vellykket, resulterer videnekstraktionen i solide data, der let kan læses og fortolkes af et givet program, hvilket giver slutbrugeren mulighed for at bruge den formelle viden til det formål, han eller hun ønsker.

Flere forskellige kilder kan bruges i processenaf videnekstraktion.Inden for omfanget af strukturerede kilder kan data ekstraheres fra forskellige typer relationelle databaser eller en eller anden form for udvideligt markeringssprog eller XML -kilde.Ustrukturerede kilder, såsom billeder, forskellige former for tekstbehandlingsdokumenter, regneark og endda tekst, der er fanget på Notepad -stilprogrammer, kan bruges som en del af ekstraktionsprocessen.Så længe kilderne kan læses for det program, der bruges til at styre videnekstraktionsprocessen, kan de bruges som kilder, der udvider potentialet for projektet, der fremføres ved hjælp af ekstraktion.

Der er flere almindelige applikationer, der forekommer med videnekstraktion.Et hyppigt eksempel er evnen til at fange data fra en ustruktureret kilde og inkorporere i en slags struktureret videnskilde.Uddrag af data, der findes i relationelle databaser og bruger dem til at oprette nye dokumenter, eller gøre brug af elektroniske dokumenter til at importere data til relationelle databaser, er et andet eksempel på, hvordan denne type ekstraktion kan fremskynde deling af formel viden uden behov for manuelt at indtaste dataDet er allerede tilgængeligt fra en anden kilde.Denne genbrug af eksisterende viden i noget nyt format er ofte meget nyttigt i en række scenarier, hvilket gør det muligt at bruge denne viden på måder, der måske ikke har været mulig med den eksisterende kilde.På denne måde kan brugeren oprette kilder, der er ideelle til en række forskellige applikationer snarere end kun dem, der er relevante for det oprindelige hjem for den formelle viden.

Ved anvendelse af dataekstraktion er det muligt at gøre brug af et enormt datalager, der let importerer og eksporterer data som en måde at skabe en ny kilde, der kan bruges til et specifikt formål.Disse nyoprettede kilder finder på sin side også et sted i datalageret og kan til sidst bruges til oprettelse af nye ekstraktioner, der bruges til at imødekomme nyere brugsbehov.Med dette i tankerne kan videnekstraktion ses som et meget nyttigt værktøj, der hjælper med at få mest muligt ud af alle ressourcer, der i øjeblikket er til rådighed, hvilket forenkler mange af de opgaver, der er involveret i delingen af den formelle viden.