sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] StopWords


From: Martin Sevigny
Subject: Re: [sdx-developers] StopWords
Date: Tue, 06 Jul 2004 07:01:45 +0200
User-agent: Mozilla Thunderbird 0.6 (Windows/20040502)

Salut,

Voici le problème détecté : Dans la classe Java d'analyse en français (fr.gouv.culture.sdx.search.lucene.analysis.Analyser_fr), on hérite des mots non pertinents (traduction approximative de "stop words") de la

Dans ma terminologie à moi, rarement la bonne, stop words = mots vides.

classe mère DefaultAnalyser.

C'est un bogue, du moins si je comprends bien.

Ma compréhension est celle-ci : si on spécifie un fichier de configuration qui a des mots vides, alors dans ce cas il n'utilise pas les mots vides par défaut. Sinon il les utilise, et c'est là que c'est fautif, car une liste de mots vides ne peut pas être "par défaut", sauf à la rigueur pour une langue...

A corriger (Joran, Lorenzo?).

Martin Sévigny








reply via email to

[Prev in Thread] Current Thread [Next in Thread]