sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: RE : [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs


From: Pierrick Brihaye
Subject: Re: RE : [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs
Date: Mon, 18 Aug 2003 11:57:03 +0200
User-agent: Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.2) Gecko/20030208 Netscape/7.02

Re,

Désolé, retour de vacances : mes interventions risquent d'être un peu "hachées"...

Martin Sevigny a écrit:

+1. J'aimerais aussi la possibilité de *ne pas* définir de fieldlists ou, en clair, d'avoir des FieldList dynamiques (réservées aux utilisateurs avertis). Je ne sais pas ce que vous en pensez, mais un moissonneur utilise a priori de telles FieldLists, non ?

Moissonneur? Que veux-tu dire?

Supposons que je veuille "pomper" un site : je ne peux pas, a priori, déterminer quels seront les "champs" disponibles/accessibles. Je sais, ce n'est pas beau de pomper alors disons simplement que je veux créer un miroir :-)

Je vois un gros intérêt de faire de SDX un moteur de réplication. Pour cela, le moissonage tel qu'il est proposé par le protocole OAI-PMH me parait une excellente solution.

Ceci étant dit, le support des fieldlists dynamiques est déjà
partiellement implanté, si tu sors un <sdx:field> non prévu lors de
l'indexation il sera indexé avec un type="word" et cherchable.

OK. Pas encore bien vu mais, ici, il faudrait pouvoir déterminer si un champ inconnu est :

1) créé dynamiquement
2) ignoré
3) provoque une erreur

Bref, un comportement similaire à celui des documents attachés...

J'ai vu que SDX avait intégré les versions récentes de Lucene. Est-ce que le highlighter fonctionne encore avec ce code ?

Oui, je viens de tester et ça me semble correct. Rasik pourra confirmer.

OK. J'attends confirmation car je me suis toujours posé la question quant à savoir si le jar Lucene de SDX n'était pas un jar "maison" (qui modifierait en particulier la visibilité des méthodes). A noter que j'ai vu passer dans une liste Lucene une adaptation plus récente du code de highlighting. Je vais essayer de retrouver la ref...

Si oui, je vous propose de vous envoyer un analyseur arabe assez performant (ça explique mon silence du mois dernier ;-)

Très intéressant. Tu nous tiens au courant...?

Bien sûr... j'aurais d'ailleurs sans doute besoin de votre avis pour voir quels sont les meilleurs choix d'implémentation. Y a pas mal de TODO :-)

Question: est-ce qu'un analyseur de ce type doit se retrouver dans SDX ? Dans Lucene ? Dans un projet libre quelconque ?

Pour info, il s'aggit d'une adaptation Java de http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2002L49. J'en ai chié : l'original est en PERL :-))

A+

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden





reply via email to

[Prev in Thread] Current Thread [Next in Thread]