problemas acentos tomcat
Publicado por pablo (1 intervención) el 25/02/2009 17:44:55
Hola a todos, este es un problema que he visto varias veces en este foro. Aunque difiere un poco.
Tengo una aplicacion en java que obtiene urls y baja el contenido html de esa pagina. El problema ocurre con las vocales acentuadas, ya que dependiendo de la codificación de la pagina, o los reemplaza con un caracter extraño o directamente elimina ese caracter, quedando la palabra dividida en dos.
En mi codigo java hago algo asi:
HttpClient client = selectClient(online);
client.getParams().setParameter("http.protocol.content-charset", "UTF-8");
GetMethod method = new GetMethod(url);
method.setFollowRedirects(true);
method.addRequestHeader("Content-Type", "text/plain; charset=UTF-8");
method.addRequestHeader("User-Agent", "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.10) Gecko/20071115 Firefox/2.0.0.10");
method.addRequestHeader("Accept", "*/*");
InputStream rstream = method.getResponseBodyAsStream();
Con el rstream obtengo el contenido de la pagina, luego de pasarlo por un buffer.
En resumidas, dada una url, con este codigo obtengo el fuente de la pagina, pero las letras acentuadas y las ñ desaparecen. Alguno tiene idea de que puede estar pasando?
Muchas gracias desde ya.
Tengo una aplicacion en java que obtiene urls y baja el contenido html de esa pagina. El problema ocurre con las vocales acentuadas, ya que dependiendo de la codificación de la pagina, o los reemplaza con un caracter extraño o directamente elimina ese caracter, quedando la palabra dividida en dos.
En mi codigo java hago algo asi:
HttpClient client = selectClient(online);
client.getParams().setParameter("http.protocol.content-charset", "UTF-8");
GetMethod method = new GetMethod(url);
method.setFollowRedirects(true);
method.addRequestHeader("Content-Type", "text/plain; charset=UTF-8");
method.addRequestHeader("User-Agent", "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.10) Gecko/20071115 Firefox/2.0.0.10");
method.addRequestHeader("Accept", "*/*");
InputStream rstream = method.getResponseBodyAsStream();
Con el rstream obtengo el contenido de la pagina, luego de pasarlo por un buffer.
En resumidas, dada una url, con este codigo obtengo el fuente de la pagina, pero las letras acentuadas y las ñ desaparecen. Alguno tiene idea de que puede estar pasando?
Muchas gracias desde ya.
Valora esta pregunta


0