sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] UTF-8 sous Linux


From: Pierre Dittgen
Subject: [sdx-users] UTF-8 sous Linux
Date: Mon, 10 Nov 2003 11:31:38 +0100
User-agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.5) Gecko/20031007

Bonjour,

Je suis en train de mettre en place une application SDX sous Linux. J'utilise le JDK 1.4.1, Tomcat 4.1.29 et SDX 2.1 CVS. La machine est "UTF-8 aware", les différentes tables de caractère sont installées et je peux manipuler de l'UTF-8 avec d'autres programmes.

Le problème est le suivant : lorsque j'accède à mon application et que je saisis des chaînes accentuées, je me retrouve avec des caractères bizzares dans les documents. Le problème ne se pose pas avec des documents créés ailleurs (sur mon poste WinXP) et importés ensuite sur la machine.

Je pense avoir mis 'UTF-8' un peu partout où il fallait (web.xml pour le traitement des formulaires, les différents sitemap.xmap, la variable d'environnement CATALINA_OPTS avec la valeur -Djava.lang.encoding=UTF-8)

En investigant un peu, j'ai vu que le header HTTP posait problème :

Date: Mon, 10 Nov 2003 12:16:43 GMT
Server: Apache-Coyote/1.1
Content-Type: text/html;charset=ISO-8859-1
Client-Date: Mon, 10 Nov 2003 10:18:32 GMT
Client-Peer: 193.50.232.84:9000
Client-Response-Num: 1
Set-Cookie: JSESSIONID=030298B00AFC80A547916311B99C45AB; Path=/sdx
X-Cocoon-Version: 2.0.4

Vous remarquerez l'indication du charset (ISO-LATIN-1) qui est erroné (ou du moins pas celui que je souhaite)... Ma page est pourtant sérialisée en UTF-8 et je précise le codage dans le header HTML mais c'est le header HTTP qui prime. Je me retrouve avec des caractères bizarres à la saisie... Un contournement consiste à forcer l'encodage de la page dans le navigateur mais ce n'est pas vraiment pratique et en plus ce n'est valable que pour la page courante :-(

Sous Windows, je n'ai pas ce problème... En examinant le header HTTP sur ce système, j'obtiens :

Date: Mon, 10 Nov 2003 10:11:40 GMT
Server: Apache Coyote/1.0
Content-Type: text/html
Client-Date: Mon, 10 Nov 2003 10:13:22 GMT
Client-Peer: 192.168.0.16:8080
Client-Response-Num: 1
Client-Transfer-Encoding: chunked
Set-Cookie: JSESSIONID=13D6EC1B5FD97A072288C68E1577A091; Path=/sdx
X-Cocoon-Version: 2.0.4

Cette fois-ci, l'encodage n'est pas précisé ! Du coup, celui donné dans le header HTML doit être pris en compte. Savez-vous où quel est le fichier de configuration magique permettant de modifier (ou supprimer) l'affichage du charset dans le header HTTP produit par Cocoon ?

Merci d'avance
Pierre
--
Pierre Dittgen, address@hidden
PASS Technologie http://www.pass-tech.fr






reply via email to

[Prev in Thread] Current Thread [Next in Thread]