sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: RE : RE : [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs


From: Pierrick Brihaye
Subject: Re: RE : RE : [sdx-developers] SDX 2.2 : suggestions d'ajouts mineurs
Date: Mon, 18 Aug 2003 12:39:17 +0200
User-agent: Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.2) Gecko/20030208 Netscape/7.02

Re,

Martin Sevigny a écrit:

Oui et non. OAI-PHH repose sur le fait que tu connais a priori le >format XML que
tu échanges, puisqu'il doit y avoir un schéma.

Certes : j'aurais dû écrire OAI-PMH-like :-) Bref, un truc avec un schéma d'URL qui se veut standard. L'idéal serait, bien sûr, d'avoir des verbes du genre :

verb=getRessource&identifier=xxx&mimeType=text/xml
verb=getResourceSchema&identifier=xxx&mimeType=text/dtd

C'est un JAR maison

OK. J'attends la réaction de Rasik mais j'aimerais que l'on revienne au Lucene canonique (même si beaucoup de choses restent en suspens) ou que l'on fournisse les classes à surcharger de façon à ce que je puisse greffer l'analyseur arabe (les répertoires sont encore dans le CVS).

Je ne sais pas, mais il gagne à être connu. De toutes façons, s'il est
dans un projet distinct, je pense que ce serait une bonne chose
d'intégrer le JAR dans SDX.

Oui.

Pour info, il s'aggit d'une adaptation Java de http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LD

C2002L49. J'en ai chié : l'original est en PERL :-))
-----

OK, cool!

Je vous mets à dispo le code dans on état actuel (et un test case) dès ce soir : vous verrez qu'on a déjà un problème potentiel, à savoir que le démarrage est très lent (~ 1 minute sur ma bécane) car il charge un énorme dictionnaire. Est-ce compatible avec la philosophie SDX ?

Bien sûr, il y a d'autres problèmes, mais je les explicitererai au fur et à mesure. Rien de bien méchant en tout état de cause : ce truc est diaboliquement performant.

PS : je cherche quasiment desespérement du XML en arabe. Pour l'instant, je n'ai trouvé "que" le Coran :-)

A+

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden





reply via email to

[Prev in Thread] Current Thread [Next in Thread]