[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [sdx-developers] StopWords
From: |
Martin Sevigny |
Subject: |
Re: [sdx-developers] StopWords |
Date: |
Tue, 06 Jul 2004 07:01:45 +0200 |
User-agent: |
Mozilla Thunderbird 0.6 (Windows/20040502) |
Salut,
Voici le problème détecté : Dans la classe Java d'analyse en français
(fr.gouv.culture.sdx.search.lucene.analysis.Analyser_fr), on hérite des
mots non pertinents (traduction approximative de "stop words") de la
Dans ma terminologie à moi, rarement la bonne, stop words = mots vides.
classe mère DefaultAnalyser.
C'est un bogue, du moins si je comprends bien.
Ma compréhension est celle-ci : si on spécifie un fichier de
configuration qui a des mots vides, alors dans ce cas il n'utilise pas
les mots vides par défaut. Sinon il les utilise, et c'est là que c'est
fautif, car une liste de mots vides ne peut pas être "par défaut", sauf
à la rigueur pour une langue...
A corriger (Joran, Lorenzo?).
Martin Sévigny