Skip to main content

Wat is gecontroleerd vocabulaire?

Gecontroleerde vocabulaire is een concept in informatica en computerprogrammering waarbij alleen eerder overeengekomen of goedgekeurde voorwaarden worden gebruikt bij het construeren van relationele databases, doorzoekbare metadata of andere systemen waarin mensen leesbare woorden worden gebruikt om informatie te markeren voor later ophalen.De methode voor het gebruik van een gecontroleerde vocabulaire om informatie te classificeren, staat in contrast met het concept van natuurlijke taalvocabulaire, waarin er geen overeengekomen termen zijn en alle gebruikte woorden worden in plaats daarvan verbonden door gewogen relaties.Naast de woorden op het hoogste niveau die worden gebruikt in een gecontroleerde vocabulaire, kunnen ondersteunende woorden worden gebruikt zodat synoniemen of andere termen die sterk worden geassocieerd met de term op het hoogste niveau, het gebruik van het woord op het hoogste niveau kan activeren.De belangrijkste verschillen die worden gemeten tussen natuurlijke taalsystemen en gecontroleerde vocabulaire systemen zijn de relevantie van de resultaten van een query met behulp van de woorden, het geretourneerde deel van de informatie en de algehele bruikbaarheid van het systeem.

Er zijn veel gevallen waarin eenHet verzamelen van woorden of termen wordt gebruikt om informatie te maken die willekeurig is, voortdurend veranderend of ongeorganiseerd voor gebruikers.Zoektermen binnen een internetzoekmachine, een bedrijfsinformatiedatabase en zelfs een digitale onderzoeksbibliotheek zijn allemaal voorbeelden van applicaties waardoor informatie kan worden gecategoriseerd met metadata -termen in tegenstelling tot een strikte hiërarchische structuur.Bestanden moeten op een bepaalde manier worden gecategoriseerd, zodat ze gemakkelijk en voorspelbaar zijn.Als een bestand met auto's gaat, kan het worden ingediend onder de categorieauto's.Als een andere persoon ook een bestand heeft dat zich bezighoudt met auto's, zonder een gecontroleerde vocabulaire, kan het bestand onder de kopauto's worden geplaatst, waardoor de twee bestanden moeilijk te vinden zijn met één zoekopdracht.Wanneer de categorieën worden bestuurd, zouden alle bestanden die met auto's worden behandeld, worden geplaatst onder een enkele overeengekomen kop.

Het voordeel van het gebruik van een gecontroleerde vocabulaire is dat informatie strikt wordt beschreven op een voorspelbare manier.Dit betekent dat iedereen die op de hoogte is van de woordenschat in staat zal zijn om effectief en nauwkeurig naar informatie te zoeken.Een complicatie met de woordenschat is echter dat de zoektermen moeilijker, zo niet onmogelijk zijn om automatisch te genereren en meestal wat menselijke tussenkomst vereisen, waardoor het een grote taak is om bestaande databases om te zetten om een gecontroleerde woordenschat te gebruiken.Als de woordenschat niet groot genoeg is, dan is er ook de mogelijkheid dat een enkele zoekopdracht zo'n grote hoeveelheid informatie naar voren brengt dat het onpraktisch wordt om te sorteren zonder het gebruik van een andere querymethode.