[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [sdx-developers] RE : Derniers commits
From: |
Pierrick Brihaye |
Subject: |
Re: [sdx-developers] RE : Derniers commits |
Date: |
Fri, 06 Sep 2002 12:05:35 +0200 |
User-agent: |
Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.1) Gecko/20020823 Netscape/7.0 |
Pierrick Brihaye a écrit:
Or "s1/bora"
matche bien "<HAS_DIGIT> <P> <ALPHANUM>". Pour le slash de fin, je donne
ma langue au chat...
Surtout qu'il n'y a pas de slash de fin :-)
Bref, j'ai l'impression qu'il y a du boulot avec ce tokenizer. en
particulier, leur modèle pour NUM me semble un peu foireux et heurte ma
conscience sientifique :-)
Je me propose éventuellement de travailler à-dessus au coup par coup.
Pour cela, il faudrait placer le StandardTokenizer dans les sources SDX
(on a déjà la réécriture de la classe Document de Lucene), se mettre
éventuellement d'accord sur un autre nom et disposer des outils de
compilation.
--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden