Skip to main content

Co to jest kontrolowane słownictwo?

Słownictwo kontrolowane to koncepcja w zakresie informatyki i programowania komputerowego, która obejmuje używanie tylko wcześniej uzgodnionych lub zatwierdzonych terminów podczas konstruowania relacyjnych baz danych, metadanych do wyszukiwania lub innych systemów, w których słowa są używane do oznaczania informacji do późniejszego pobierania.Metodologia stosowania kontrolowanego słownictwa do klasyfikowania informacji jest bezpośrednio kontrastowa z koncepcją słownictwa języka naturalnego, w którym nie ma uzgodnionych warunków, a wszystkie używane słowa są zamiast tego połączone relacjami ważonymi.Oprócz słów najwyższego poziomu, które są używane w kontrolowanym słownictwie, można użyć słów pomocniczych, więc synonimy lub inne terminy, które są silnie powiązane z terminem na najwyższym poziomie, mogą wyzwolić użycie słowa najwyższego poziomu.Główne różnice mierzone między systemami języka naturalnego a kontrolowanymi systemami słownictwa są znaczenie wyników zapytania przy użyciu słów, objętości zwróconych informacji i ogólna użyteczność systemu.

Istnieje wiele przypadków, w których aZbieranie słów lub warunków służy do tworzenia informacji, które są arbitralne, stale zmieniające się lub zdezorganizowane bardziej dostępne dla użytkowników.Wyszukiwane kategorie w wyszukiwarce internetowej, korporacyjnej bazie danych informacji, a nawet cyfrowej biblioteki badawczej są przykładami aplikacji, za pomocą których informacje można podzielić na warunki metadanych, w przeciwieństwie do ścisłej struktury hierarchicznej.Słowa używane do opisania obiektu w takich sytuacjach budują rodzaj indeksu możliwego do przeszukiwania większej puli informacji.

Jeden przykład użycia kontrolowanego słownictwa można zobaczyć przy rozważaniu systemu zgłoszenia dla firmy.Pliki muszą być kategoryzowane w sposób, aby były łatwe i przewidywalnie do pobierania.Jeśli jeden plik dotyczy samochodów, można go złożyć pod samochodami kategorii.Jeśli inna osoba ma również plik, który zajmuje się samochodami, bez kontrolowanego słownictwa, plik może być umieszczony pod nagłówkiem samochodów, co utrudnia znalezienie dwóch plików za pomocą jednego wyszukiwania.Gdy kategorie są kontrolowane, wszystkie pliki dotyczące samochodów zostaną umieszczone w ramach jednego uzgodnionego na kierunku.

Korzyści z użycia kontrolowanego słownictwa jest to, że informacje są ściśle opisane w przewidywalny sposób.Oznacza to, że każdy, kto jest świadomy słownictwa, będzie w stanie skutecznie i dokładnie szukać informacji.Komplikacją słownictwa jest jednak to, że wyszukiwane terminy są trudniejsze, jeśli nie niemożliwe, generowanie automatycznie i zwykle wymagają pewnej interwencji człowieka, co czyni dużym zadaniem konwersji istniejących baz danych w celu użycia kontrolowanego słownictwa.Jeśli słownictwo nie jest wystarczająco duże, istnieje również możliwość, że jedno zapytanie przyniesie tak dużą ilość informacji, że sortowanie bez użycia innej metody zapytania staje się niepraktyczne