sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : [sdx-users] Bug servlets


From: Martin Sévigny
Subject: RE : [sdx-users] Bug servlets
Date: Mon, 11 Feb 2002 14:14:26 +0100

Bonjour,

-----
j'ai remarqué un bug (que je crois déjà avoir signalé a Martin) sur
l'utilisation
des servlets sdx.

sur une recherche de document si on a plusieurs fois le m^m champ
d'indexation
ex :
<doc id="1">
    <titre>test</titre>
    <lien>02</lien>
    <lien>03</lien>
    <lien>04</lien>
</doc>

et que l'on indexe par exemple le champ lien

lors d'une requête de recherche on a toujours la valeur du dernier
élément qui est recopié dans toutes les autres :
-----

Oui, ça a été signalé, mais en fait c'est une limite de Lucene derrière
SDX : il ne peut pas retourner toutes les valeurs des champs
multivalués. La méthode getField de la classe
com.lucene.document.Document dit ceci : "If multiple fields may exist
with this name, this method returns the last added such added".

Il y a deux façons de contourner ce problème :

A) Si c'est surtout pour de l'affichage, on peut créer un champ (non
indexé à la rigueur) qui concatène les valeurs dans le but de les
afficher comme vous voulez en résultat

B) Si c'est pour exploiter ces valeurs et que les documents XML sont
relativement petits, vous pouvez inclure les documents XML au complet
dans les résultats (à la place des champs). A ce moment, si vous avez
été capable d'indexer les champs individuellement, le même traitement
XSL permettra de les individualiser à l'affichage.

Je ne sais pas si la dernière version de Lucene permet d'aller chercher
une occurrence spécifique, si oui SDX 2 le permettra également. Sinon on
verra...

A bientôt,

Martin Sévigny




reply via email to

[Prev in Thread] Current Thread [Next in Thread]