Python - Dividir linea de texto

Pos: 113

Val: 27

Dividir linea de texto

Publicado por Josafat (18 intervenciones) el 09/10/2018 04:03:16

Hola que tal, tengo un problema a la hora de extraer todas las url de un archivo txt, el problema es que a la hora de extraer las url hay algunas que deja juntas, como se muestra abajo:

http://www.itapizaco.edu.mx/magazine/index.htmlhttp://www.google.com/bot.html
http://www.itapizaco.edu.mx/magazine/files/mobile/index.htmlhttp://www.google.com/bot.html

yo quiero que aparezcan con salto de linea cada vez que comienza otra url, muestro mi código adelante y ojalá alguién pueda ayudarme con mi problema

import re

cleanUrls=[]

urls2=[]

file2 = open("url.txt", "w")

with open("access.log") as file:

        for line in file:

            urls = re.findall('http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', line)

            if urls not in cleanUrls:

            #cleanUrls.append(urls)

            	cleanUrls.append(urls)

        for u in cleanUrls:

        	str1 = ''.join(u)

        	if len(str1)>0:

        		file2.write(str1.rstrip(')'))

        		file2.write("\n")

Valora esta pregunta

Me gusta: Está pregunta es útil y esta clara

No me gusta: Está pregunta no esta clara o no es útil

Responder

Pos: 3

Val: 2.239

Dividir linea de texto

Publicado por xve (1646 intervenciones) el 09/10/2018 08:40:17

Hola Josefa, nos puedes mostrar el contenido del archivo access.log para poder probarlo?

Valora esta respuesta

Me gusta: Está respuesta es útil y esta clara

No me gusta: Está respuesta no esta clara o no es útil

Comentar

Pos: 113

Val: 27

Dividir linea de texto

Publicado por Josafat (18 intervenciones) el 09/10/2018 18:08:35

https://drive.google.com/open?id=1zT3gPyvex6WTyVeiUzgsgKwtd7v5H_KA
Si puedes descargar el archivo y ayudarme te lo agradecería

Valora esta respuesta

Comentar

Partir cadena en posición x

Numeros primos con teorema Wilson