sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-users] Indexation


From: Pierrick Brihaye
Subject: Re: [sdx-users] Indexation
Date: Tue, 5 Mar 2002 19:05:56 +0100

----- Message d'origine ----- 
De : "Martin Sévigny" <address@hidden>

> Normal pour un outil de recherche ;-)

Sur le principe, on est d'accord mais comme la majeure partie du développement 
d'une appli SDX est censée concerner des fonctionnalités qui ne sont pas 
livrées en standard... cet aspect avait été un peu négligé de ma part :-)

>A) La troncature est supportée en FieldSearch. Avec * et ? n'importe où
>dans la chaîne recherchée. Du moins il me semble. Enfin, je viens de
>tester pour vérifier et ça marche parfaitement.

On est d'accord... surtout depuis que je viens fixer le bug sur SdxFieldQuery 
;-)

>B) Ne pas oublier que l'on peut définir plusieurs champs avec le même
>contenu (par exemple un en minuscules et l'autre en respectant la casse)

On est aussi d'accord, mais là, je parle bien de *requête*.

>Sinon, personnellement j'aime bien la notion que dans un champ de type
>field, SDX prend exactement ce qu'on lui donne. 

On est toujours d'accord (n'est-ce pas merveilleux ?). Surtout que le mécanisme 
d'indexation XSLT permet vraiment de faire pas mal de choses...

>En particulier dans un
>contexte multilingue, où justement la casse n'est pas un concept
>universel.

Ce n'est pas moi qui dirai le contraire ;-) Nous sommes donc... d'accord :-))

Mais bon : On a dans un SDX un mécanisme assez astucieux (si, si, j'insiste) 
d'optimisation des troncatures qui va rechercher les valeurs d'index 
correspondantes, d'assembler ces termes dans la requête et de lancer la requête 
*préalablement* assemblée. Pour que ça soit moins abstrait, je donne un exemple 
:

"deno:mais*" va chercher "deno:maison" et "deno:maisons" et envoie une requête 
"OU" avec ces deux valeurs et *elles-seules*... Je me demandais simplement si 
on ne pouvait pas avoir un mécanisme identique, lors de la requête donc, pour 
faire correspondre des majuscules/minuscules.

>Tout ceci est vrai, mais... L'une des rares fonctions modulaires dans
>SDX est justement l'analyseur de mots. Pour avoir son propre analyseur
>de mots, on fait ceci :
>- créer et compiler une classe Java qui respecte l'interface
>com.lucene.analysis.Analyzer

J'ai bien compris mais je me demandais si on pouvait *externaliser* la *liste* 
des mots vides plutôt que de les coder en dur dans une classe. A terme , 
j'imagine qu'il sera possible d'externaliser certaines ressources, ce qui 
présuppose une organisation stricte des fichiers de configuration...

p.b.


reply via email to

[Prev in Thread] Current Thread [Next in Thread]