caracteres ¡ y ¿ y Python
Publicado por almuki87 (7 intervenciones) el 18/04/2016 11:53:34
Hola
Tengo un problemita con los caracteres ¡ ¿
Mi programa ahora mismo descarga todo tipo de textos en castellano desde twitter.
Dentro de estos textos tengo que separar los signos de puntuación de las palabras para poder meterlos en una lista y buscar coincidencias.
El problema es que usando expresiones regulares de Python no me identifica los signos de puntuación que normalmente se usan en castellano como por ejemplo ¡ ¿ '(apóstrofe) y no sé cómo hacer que los identifique para separarlos del resto del texto.
Estoy usando expresiones regulares y codificación UTF-8.
mm = re.sub(r"([^\w\s]+)\s", r" \1 ", texto) Todo lo que no sea caracteres alfanuméricos o caracteres de espacio quiero que lo separe como: [espacio]+simbolo+[espacio]. El problema es que con los símbolos que comento no funciona.
Tengo un problemita con los caracteres ¡ ¿
Mi programa ahora mismo descarga todo tipo de textos en castellano desde twitter.
Dentro de estos textos tengo que separar los signos de puntuación de las palabras para poder meterlos en una lista y buscar coincidencias.
El problema es que usando expresiones regulares de Python no me identifica los signos de puntuación que normalmente se usan en castellano como por ejemplo ¡ ¿ '(apóstrofe) y no sé cómo hacer que los identifique para separarlos del resto del texto.
Estoy usando expresiones regulares y codificación UTF-8.
mm = re.sub(r"([^\w\s]+)\s", r" \1 ", texto) Todo lo que no sea caracteres alfanuméricos o caracteres de espacio quiero que lo separe como: [espacio]+simbolo+[espacio]. El problema es que con los símbolos que comento no funciona.
Valora esta pregunta


0