sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] lexical analyzers


From: Jos Snellings
Subject: Re: [sdx-developers] lexical analyzers
Date: Thu, 6 Oct 2005 10:32:38 +0200

Ceci est exactement ce que je comptais faire un jour en indexant les
documents provenants de
différents pays. Seulement ... il ne m'est pas claire comment faire en xsl
(feuille de style d'indexation).
Vous avez des suggestions ? Ou il vaut mieux proposer un patch?

Concernant les LexicalAnalyzers pour les langues de grande variabilité
morphologique: il se fait que je connais
l'auteur d'un Lexical Analyzer pour le Hongrois. Je suis aussi à la
recherche d'un "FinnishStemmer, FinnishAnalyzer etc",
j'oserais supposer que de nouveau analyseurs serait chaleureusement
acceuilli dans SDX?

Merci de ces précisions, à bientôt!
Jos

----- Original Message -----
From: "Pierrick Brihaye" <address@hidden>
To: <address@hidden>
Sent: Wednesday, October 05, 2005 3:17 PM
Subject: Re: [sdx-developers] lexical analyzers


Salut,

Jos Snellings wrote:

> Pour indexer les documents, SDX sélectionne un "Analyzer", à la base
> d'informations qu'il reçoit du fichier de configuration
> ("locale" du champ à indexer).
> Néanmoins, pour une base de documents en plusieures langues il nous en
> faut plusieurs.
>
> Il serait beau quand SDX pourrait sélectionner un analyser à la base de
> la langue du document, si cette information lui serait fourni
> d'une manière ou autre, par exemple si l'élément racine d'un document
> portait un attribut "xml:lang".
> Est-ce que ce genre de comportement est planifié?

Voir une mise en oeuvre *en recherche* :

http://savannah.nongnu.org/cgi-bin/viewcvs/sdx/demos/quran/search.xsp?annota
te=1.6

lignes 65-106.

Il devrait être possible de faire quelque chose de similaire en
indexation et, mieux, dans la logisheet.

> Quels Analyseurs sont en effet chargé dans SDX à l'heure actuel? C'est
> fr, de, ru, br, ...?

l'arabe :-)

A+

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden
+33 (0)2 99 29 67 78


_______________________________________________
sdx-developers mailing list
address@hidden
http://lists.nongnu.org/mailman/listinfo/sdx-developers





reply via email to

[Prev in Thread] Current Thread [Next in Thread]