¿Qué es el vocabulario controlado?
El vocabulario controlado es un concepto en informática y programación de computadoras que implica el uso de términos solo previamente acordados o aprobados al construir bases de datos relacionales, metadatos de búsqueda u otros sistemas en los que las palabras legibles por humanos se usan para marcar información para una recuperación posterior. La metodología de usar un vocabulario controlado para clasificar la información está en contraste directamente con el concepto de vocabulario del lenguaje natural, en el que no hay términos acordados y todas las palabras que se usan están conectadas por relaciones ponderadas. Además de las palabras de nivel superior que se usan en un vocabulario controlado, se pueden usar palabras de apoyo para que los sinónimos u otros términos que estén fuertemente asociados con el término de nivel superior pueden desencadenar el uso de la palabra de nivel superior. Las principales diferencias que se miden entre los sistemas de lenguaje natural y los sistemas de vocabulario controlados son la relevancia de los resultados de una consulta utilizando las palabras, el volumen de información devuelto y el OVEUsabilidad de la concentración del sistema.
Hay muchas instancias en las que se usa una colección de palabras o términos para hacer información arbitraria, cambiando o desorganizado constantemente a los usuarios. Los términos de búsqueda dentro de un motor de búsqueda de Internet, una base de datos de información corporativa e incluso una biblioteca de investigación digital son ejemplos de aplicaciones a través de las cuales la información se puede clasificar con términos de metadatos en lugar de una estructura jerárquica estricta. Las palabras utilizadas para describir un objeto en tales situaciones crean una especie de índice de búsqueda del grupo de información más grande.
Un ejemplo del uso del vocabulario controlado se puede ver al considerar un sistema de archivo para una empresa. Los archivos deben clasificarse de manera para que sean recuperables fácilmente y previsiblemente. Si un archivo trata con automóviles, entonces podría presentarse en la categoría "autos". Si otra persona también tiene un archivoEso se ocupa de los automóviles, sin un vocabulario controlado, el archivo puede colocarse bajo el encabezado "Automóviles", lo que dificulta encontrar los dos archivos con una sola búsqueda. Cuando las categorías se controlan, todos los archivos que se ocupan de automóviles se colocarían bajo un solo acordado al encabezado.
El beneficio de usar un vocabulario controlado es que la información se describe estrictamente de manera predecible. Esto significa que cualquier persona que esté al tanto del vocabulario podrá buscar información de manera efectiva y precisa. Sin embargo, una complicación con el vocabulario es que los términos de búsqueda son más difíciles, si no imposibles, de generar automáticamente y generalmente requieren alguna intervención humana, lo que hace que sea una gran tarea convertir las bases de datos existentes para usar un vocabulario controlado. Si el vocabulario no es lo suficientemente grande, entonces también existe la posibilidad de que una sola consulta traiga un volumen de información tan grande que se vuelve poco práctico sin el uso de otra QMétodo Uerying.