sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : [sdx-users] proposition du fichier analysis/fr_extended.xml (liste


From: Frédéric Glorieux
Subject: RE : [sdx-users] proposition du fichier analysis/fr_extended.xml (liste des mots vides de sens)
Date: Wed, 30 Apr 2003 11:09:50 +0200

> je vous propose, pour ceux que cela interesse, un fichier de mots
vides
> plus
> fourni que celui proposé en standard,regroupant 463 mots (au lieu de
60)
> frabriqué à partir de la liste se trouvant sur le site:
> http://www.unine.ch/Info/clef/

Très intéressant, mais je me demande si certains mots ne sont pas si
vides que ça ? Je pense particulièrement aux numéraux:
six, sixième, soixante...
Le mieux est de voir à l'usage.

Sur ce site j'ai regardé la liste des mots français les plus fréquents,
on y trouve par exemple politique, york (pour le jambon?), bosnie,
bosniaque...
Disons qu'il s'agit d'une fréquence assurée sur le corpus de documents
choisi, mais j'ai peur que ce corpus soit plutôt journalistique et daté.
Pour ce genre de questions, je ne sais pas si les informaticiens sont
les plus compétents. Les linguistes qui s'occupent de dictionnaires ont
peut-être plus de pertinence (Le Robert, CNRS/TLF/INALF), mais ils
n'offrent pas beaucoup de ressources publiques. 






reply via email to

[Prev in Thread] Current Thread [Next in Thread]