[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [sdx-developers] lexical analyzers
From: |
Pierrick Brihaye |
Subject: |
Re: [sdx-developers] lexical analyzers |
Date: |
Wed, 05 Oct 2005 15:17:23 +0200 |
User-agent: |
Thunderbird 1.4 (Windows/20050908) |
Salut,
Jos Snellings wrote:
Pour indexer les documents, SDX sélectionne un "Analyzer", à la base
d'informations qu'il reçoit du fichier de configuration
("locale" du champ à indexer).
Néanmoins, pour une base de documents en plusieures langues il nous en
faut plusieurs.
Il serait beau quand SDX pourrait sélectionner un analyser à la base de
la langue du document, si cette information lui serait fourni
d'une manière ou autre, par exemple si l'élément racine d'un document
portait un attribut "xml:lang".
Est-ce que ce genre de comportement est planifié?
Voir une mise en oeuvre *en recherche* :
http://savannah.nongnu.org/cgi-bin/viewcvs/sdx/demos/quran/search.xsp?annotate=1.6
lignes 65-106.
Il devrait être possible de faire quelque chose de similaire en
indexation et, mieux, dans la logisheet.
Quels Analyseurs sont en effet chargé dans SDX à l'heure actuel? C'est
fr, de, ru, br, ...?
l'arabe :-)
A+
--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden
+33 (0)2 99 29 67 78