sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-users] RE : Bug servlets


From: Pierrick Brihaye
Subject: Re: [sdx-users] RE : Bug servlets
Date: Tue, 12 Feb 2002 09:25:05 +0100
User-agent: Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:0.9.4) Gecko/20011128 Netscape6/6.2.1

Bonjour,

Sur ce coup, je vais essayer d'être didactique car j'ai bien peur de manquer quelque chose :-(

Martin Sévigny wrote:

Oui, bien sûr, pour moi la principale signification du "D" dans SDX est
là... Documentaire... Multivalué "naturel"...


Nous sommes d'accord :-)

En entrée, on a des documents XML :

<root>
  <DENO>calice</DENO>
  <DENO>patène</DENO>
</root>

On peut générer des index à partir de ce document. Imaginons que l'on génère un seul index, nommé "deno". On aura donc, comme résultat de l'indexation :

<sdx:document id="x">
  <sdx:field code="deno">calice</calice>
  <sdx:field code="deno">patène</calice>
</sdx:document>

SDX se débrouille (bien) pour transformer ce document *transitoire* en entrées d'index au formalisme exigé par Lucene.

Dans un processus inverse de l'indexation, le document "x" sera donc retourné lors d'une requête (simpleQuery p.e.) ayant une syntaxe de ce type :
+deno:"calice" +deno:"patène"

On est donc bien documentaire, non ? ;-)

Il se trouve que mes documents XML sont d'une forme un peu différente (inutile de développer : ça n'intéressera personne) :

<root>
  <DENO>calice;patène</DENO>
</root>

Heureusement, je peux me débrouiller avec XSLT pour obtenir la *même* indexation, c.a.d.

<sdx:document id="x">
  <sdx:field code="deno">calice</calice>
  <sdx:field code="deno">patène</calice>
</sdx:document>

Ainsi, la même requête que précédemment me renverra le document "x" ; on est donc bien dans la même approche documentaire, même si, en entrée, mes documents ont un formalisme moins... carré.

Si SDX est capable de me retourner les résultats, c'est que :
- Lucene est capable de générer *différentes* entrées d'un *même* index pour un *même* document. - Lucene a été capable de retrouver ces *différentes* entrées dans un *même* index et de les associer à un *même* document, élément de l'ensemle des résultats de la dite requête. Ce document peut en tout ou partie être inclus dans un sdx:result élément d'un sdx:results.

C'est pourquoi je ne comprends pas le bug (ou la limitation) de Lucene ni la façon dont il s'exprime lorsque l'index est retourné dans les résultats par le biais de brief="1".

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden




reply via email to

[Prev in Thread] Current Thread [Next in Thread]