Skip to main content

Qu'est-ce que la désambiguïsation du sens des mots?

La désambiguïsation du sens des mots (WSD) se trouve au cœur des logiciels conçus pour interpréter la langue.Des mots ou des phrases ambigus peuvent être compris plusieurs façons, bien qu'une seule signification soit destinée. Dis L'ambiguation cherche à déchiffrer la signification voulue des mots et des phrases.Ce domaine est extrêmement difficile pour les programmeurs chargés de concevoir des interfaces précises pour combler l'écart entre le langage parlé et écrit, et les traductions générées par ordinateur.

Le logiciel conçu pour convertir la parole à texte peut «écouter» un utilisateur parlant dans un microphoneet traduire les mots prononcés en phrases dactylographiées.L'utilisateur dicte la ponctuation, interdisant des mots comme «virgule» et «période» le cas échéant.Cela semble assez simple, sauf que de nombreux mots semblent exactement similaires.

Par exemple, connaître et non ou i et œil sont phonétiquement indiscernables.La désambiguïsation des mots des mots aide à traduire: «Je devrais savoir d'ici la semaine prochaine», correctement, en utilisant ce qui est essentiellement un ensemble de règles «si, alors» qui prennent en considération les mots de mots et les mots adjacents comme indicateurs du mot prévu.Ce type de désambiguïsation du sens des mots est connu sous le nom de «approche superficielle» et est assez exact, mais ne peut pas toujours être compté.

Une autre approche consiste à appliquer les «connaissances mondiales» ou à ce que la linguistique informatique appelle «une approche profonde».Cette approche repose sur des lexiques comme les dictionnaires et le thésaurus pour aider à déterminer le bon sens d'un mot.Malheureusement, la conception d'une base de données d'approche profonde qui est suffisamment complète pour assurer une meilleure précision que l'approche superficielle n'est pas une tâche facile.

Le logiciel qui lit à haute voix le texte (texte-to-dispeophe) nécessite également une désambiguïsation du sens des mots.Le mot

basse

, par exemple, pourrait signifier un instrument de musique, une note ou un poisson.Dans ce dernier cas, il est prononcé différemment, le laissant à WSD pour déduire la prononciation à utiliser.Si la phrase dactylographiée se trouve, «la basse est lourde», seule un scan de phrases environnantes peut révéler des indices, comme trouver les mots «pêche», «bateau», «quai», ou inversement, «groupe», ««musique »ou« chanson ».Si la désambiguïsation des mots du programme du programme n'est pas suffisamment robuste, ou si des indices supplémentaires sont absents, le programme peut faire des erreurs de traduction.

En plus des règles «si, alors» de l'approche peu profonde, des algorithmes sont également utilisés pour déterminer les interprétations correctes.Dans l'exemple ci-dessus, un algorithme peut trouver des mots clés dans tout le document qui pointent clairement vers une interprétation musicale, ou visa versa.D'autres approches sont également utilisées dans le WSD qui sont essentiellement des raffinements ou des extensions de ces approches de base.

La désambiguïsation du sens des mots est également vitale dans les interfaces de commande verbale conçues pour remplacer le clavier mdash;Non seulement pour relasser les commandes du système d'exploitation simples, mais dans des tâches aussi complexes telles que la recherche sur le Web.D'autres domaines où le WSD joue un rôle comprend le développement du Web sémantique et l'amélioration des modèles d'intelligence artificielle.En effet, tout domaine scientifique qui repose sur un pont linguistique entre l'homme et la machine utilisera la désambiguïsation des mots.