sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : [sdx-developers] RE : SDX 2 : implantation des entrepots de documen


From: Martin Sévigny
Subject: RE : [sdx-developers] RE : SDX 2 : implantation des entrepots de documents
Date: Thu, 28 Mar 2002 09:27:45 +0100

Salut,

> > Je pense que j'ai précisé : la base est responsable de 
> l'indexation, 
> 
> 
> ... Lucene. Si on prévoit d'autres types de query, le 
> mécanisme pourrait 
> éventuellement être différent ? En gros, c'est ça qui me 
> gêne. Mais pas 
> plus que ça !

Oui, je comprends. En fait, moi aussi ça me gène parce que pour
l'instant je n'ai pas de réponse plus précise. Il faut réfléchir à ce
qu'implique le fait d'avoir plusieurs types de requêtes, et à ce moment
on verra peut-être plus clair.

> OK. Je me demande d'ailleurs si, cet été, je ne vais pas me faire une 
> extension spatiale à Lucene : en gros, on stocke les données 
> géométriques sous forme textuelle (format WKT de l'OGC), et, 
> lors de la 
> requête on recherche tout ce qui est dans la bounding box désirée 
> (facile, c'est un test >= x0 and <= x1 and >= y0 and <= y1). 
> Ensuite, on 
> *filtre* en construisant les objets géométriques géométriques 
> éligibles 
> et en leur appliquant l'opérateur géométrique fourni dans la 
> requête. On 
> ne retourne que ce ce qui a passé l'épreuve de la bounding box et de 
> l'opérateur... On est d'accord que Lucene n'est pas 
> réellement fait pour 
> ça, mais sa performance est si intéressante que je me demande 
> si ça ne 
> vaut pas le coup...

Ca peut être intéressant.

> > Si je le trie c'est une autre histoire...
> 
> 
> Oui, mais, hélas, tout résultat retourné au client se doit à mon avis 
> d'être trié autrement que par pertinence : on est 
> généralement dans de 
> la documentation structurée. Un résultat intermédiaire, je ne dis pas.

En fait, vous êtes dans de la base de données, c'est pour ça que vous
voulez trier systématiquement! ;) Dans du documentaire, c'est bien le
tri autre que pertinence, mais moins fondamental à mon avis. Même pour
du documentaire où on a du document structuré. D'ailleurs, selon ma
définition du document structuré (qui n'est pas plus valable qu'une
autre), les dossiers d'inventaire n'en font pas partie.

Ceci étant dit, c'est vrai qu'une optimisation du tri des résultats de
recherche serait un gain de performance très important. Le faire dans un
SGBD peut-être, ou avoir des routines de tri qui fonctionnent avec des
fichiers temporaires.

> > En fait, tu veux avoir du WebDAV directement sur SDX? Voir
> > http://www.webdav.org/ et, peut-être encore mieux, voir le support
> > WebDAV dans Tomcat 4 et http://www.mucl.de/~jmetzner/xincon/ pour un
> > test de support WebDAV directement dans Xindice...
> 
> 
> Je regarde ça...

Ouais, et en le faisant pense à un outil de production de documents XML
qui commence par P...

A bientôt,

Martin Sévigny




reply via email to

[Prev in Thread] Current Thread [Next in Thread]