sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: RE : [sdx-users] proposition du fichier analysis/fr_extended.xml(lis


From: maisonneuve nico
Subject: Re: RE : [sdx-users] proposition du fichier analysis/fr_extended.xml(liste des mots vides de sens)
Date: Wed, 30 Apr 2003 11:18:48 +0000








From: Frédéric Glorieux <address@hidden>
Reply-To: address@hidden
To: <address@hidden>
Subject: RE : [sdx-users] proposition du fichier analysis/fr_extended.xml(liste des mots vides de sens)
Date: Wed, 30 Apr 2003 11:09:50 +0200

> je vous propose, pour ceux que cela interesse, un fichier de mots
vides
> plus
> fourni que celui proposé en standard,regroupant 463 mots (au lieu de
60)
> frabriqué à partir de la liste se trouvant sur le site:
> http://www.unine.ch/Info/clef/

Très intéressant, mais je me demande si certains mots ne sont pas si
vides que ça ? Je pense particulièrement aux numéraux:
six, sixième, soixante...


Le mieux est de voir à l'usage.

Sur ce site j'ai regardé la liste des mots français les plus fréquents,
on y trouve par exemple politique, york (pour le jambon?), bosnie,
bosniaque...
Disons qu'il s'agit d'une fréquence assurée sur le corpus de documents
choisi, mais j'ai peur que ce corpus soit plutôt journalistique et daté.
Pour ce genre de questions, je ne sais pas si les informaticiens sont
les plus compétents. Les linguistes qui s'occupent de dictionnaires ont
peut-être plus de pertinence (Le Robert, CNRS/TLF/INALF), mais ils
n'offrent pas beaucoup de ressources publiques.


oui je suis d'accord..
d'autant plus que je travaille dans le domaine de la recherche pedagogique et que les mots ; six, sixième, soixante .. peuvent être importants

mais bon, mieux vaut plus de mots, quitte à en éliminer pour certains cas, que moins et devoir en remplir :)

nico

_________________________________________________________________
MSN Search, le moteur de recherche qui pense comme vous ! http://search.msn.fr/worldwide.asp





reply via email to

[Prev in Thread] Current Thread [Next in Thread]