[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[sdx-users] Indexation
From: |
Pierrick Brihaye |
Subject: |
[sdx-users] Indexation |
Date: |
Mon, 4 Mar 2002 19:10:48 +0100 |
Bonsoir,
Comme vous le savez, ma grande préoccupation du moment est l'indexation :-))
J'ai quelques questions à poser sur ce sujet. Je n'ignore pas bien sûr que tous
les aspects mentionnés pourraient être résolus en amont, lors de l'indexation
des documents par des transformations adéquates des contenus destinés à
alimenter les index.
1er point : les index de type "champ". Les valeurs sont indexées telles
quelles, soit. Ca me paraît tenir la route. Mais peut-on concevoir une
*recherche* sur ce type de champ qui ne soit pas sensible à la casse et,
éventuellement, à l'accentuation de la même manière qu'on a une
ExactFieldSearch (vs FieldSearch) qui accepte les troncatures, au moins dans
certaines conditions ?
2ème point : les index de type "mot". Ici, c'est l'indexation en tant que telle
qui me gène. Apparemment, le parsage mot par mot se fait selon la notion
"d'espaces" au sens XML du terme(espaces, sauts de lignes, tabulations...).
Pourrait-on également concevoir avoir une liste de signes de séparation
(ponctuation au sens large incluant les parenthèses, les crochets...) ?
Pierrick Brihaye
mailto:address@hidden
- [sdx-users] Indexation,
Pierrick Brihaye <=