sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] RE : Derniers commits


From: Pierrick Brihaye
Subject: Re: [sdx-developers] RE : Derniers commits
Date: Fri, 06 Sep 2002 12:05:35 +0200
User-agent: Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.1) Gecko/20020823 Netscape/7.0

Pierrick Brihaye a écrit:

Or "s1/bora"

matche bien "<HAS_DIGIT> <P> <ALPHANUM>". Pour le slash de fin, je donne ma langue au chat...

Surtout qu'il n'y a pas de slash de fin :-)

Bref, j'ai l'impression qu'il y a du boulot avec ce tokenizer. en particulier, leur modèle pour NUM me semble un peu foireux et heurte ma conscience sientifique :-)

Je me propose éventuellement de travailler à-dessus au coup par coup. Pour cela, il faudrait placer le StandardTokenizer dans les sources SDX (on a déjà la réécriture de la classe Document de Lucene), se mettre éventuellement d'accord sur un autre nom et disposer des outils de compilation.

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden





reply via email to

[Prev in Thread] Current Thread [Next in Thread]