sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] Indexation


From: Pierrick Brihaye
Subject: [sdx-users] Indexation
Date: Mon, 4 Mar 2002 19:10:48 +0100

Bonsoir,

Comme vous le savez, ma grande préoccupation du moment est l'indexation :-))

J'ai quelques questions à poser sur ce sujet. Je n'ignore pas bien sûr que tous 
les aspects mentionnés pourraient être résolus en amont, lors de l'indexation 
des documents par des transformations adéquates des contenus destinés à 
alimenter les index.

1er point : les index de type "champ". Les valeurs sont indexées telles 
quelles, soit. Ca me paraît tenir la route. Mais peut-on concevoir une 
*recherche* sur ce type de champ qui ne soit pas sensible à la casse et, 
éventuellement, à l'accentuation de la même manière qu'on a une 
ExactFieldSearch (vs FieldSearch) qui accepte les troncatures, au moins dans 
certaines conditions ?

2ème point : les index de type "mot". Ici, c'est l'indexation en tant que telle 
qui me gène. Apparemment, le parsage mot par mot se fait selon la notion 
"d'espaces" au sens XML du terme(espaces, sauts de lignes, tabulations...). 
Pourrait-on également concevoir avoir une liste de signes de séparation 
(ponctuation au sens large incluant les parenthèses, les crochets...) ?

Pierrick Brihaye
mailto:address@hidden

reply via email to

[Prev in Thread] Current Thread [Next in Thread]