sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: RE : [sdx-users] Solution pour différencier les homonymes ?


From: Frédéric Glorieux
Subject: Re: RE : [sdx-users] Solution pour différencier les homonymes ?
Date: Tue, 13 Sep 2005 11:59:21 +0200
User-agent: Mozilla Thunderbird 1.0 (Windows/20041206)


Ah, LSA... mais c'était surtout pour catégoriser automatiquement
des documents; pour la désambiguïsation sémantique les procédés
automatiques ne sont apparemment pas encore très opérationnels
(les taux de succès ne dépasseraient pas 60-80%, selon la langue,
le corpus et sa taille).

La traduction automatique a le même genre de problèmes à résoudre, et les experts n'attendent pas de progrès décisif avant... le prochain siècle.

60-80%, ce n'est pas si mal s'il on attends juste la diminution du bruit, mais il faut alors faire la même chose au moment de la requête ?

"feuille", vous voulez chercher "feuille de papier ou feuille d'arbre ?". Il vaudrait mieux quelque chose comme "feuille arbre" > "feuille arbre maronnier tilleul...", autrement dit le mécanisme déjà existant d'extension de requête contre thesaurus.

Un article de Jean Véronis faisait le point sur l'état de l'art:
        http://acl.ldc.upenn.edu/J/J98/J98-1001.pdf
Écrit en 1998, ça reste un bon point de départ...

Pour qui s'intéresse aux mots (et aux moteurs de recherche),
ne pas manquer le blog du même: http://aixtal.blogspot.com/


--
Frédéric Glorieux (AJLSM, http://ajlsm.com)




reply via email to

[Prev in Thread] Current Thread [Next in Thread]