Listar todos los archivos de una URL
Publicado por Juan (14 intervenciones) el 03/03/2021 15:05:37
Tengo un problema que no consigo solucionar. Tengo una URL en la que hay distintas carpetas según el día del mes. Es decir, en el mes de enero tengo 31 carpetas con nombres: 01,02,03,...,31. Entonces, me ayudaron el foro para conseguir listar todas las carpetas y recogerlas en variables de esta forma:
Lo que pasa es que ahora a mí me gustaría recorrer esas urls y listar los archivos de texto que hay dentro para luego a su vez abrir cada archivo de texto. Por ejemplo. Cuando i=1, con el código anterior obtendría: https://www.web.es/enero/01/ y en esa dirección tendré distintos ficheros con distintos nombres, por ejemplo: fichero1.txt, esteesotroarchivo.txt, archivo5.txt... Entonces lo que me gustaría es con otro código obtener: https://www.web.es/enero/01/fichero1.txt https://www.web.es/enero/01/esteesotroarchivo.txt etc.
He probado a usar:
Donde i es la carpeta en la que tengo los archivos que quiero listar, pero a parte de que poner la variable i no me funciona, si la sustituyo por una url completa:
Me ejecuta el código, pero me muestra todo lo que hay en la página: títulos, comentarios, etc. y yo solo querría los nombres de los archivos.
¿Cómo podría lograr esto? Gracias de antemano.
1
2
3
4
5
6
url= https://www.web.es/enero/
for i in range(1,32):
if i<10:
url_i.append(url+"0"+str(i)+"/")
else:
url_i.append(url+str(i)+"/")
He probado a usar:
1
requests.get(i,allow_redirects=True)
1
requests.get("https://www.web.es/enero/01/",allow_redirects=True)
¿Cómo podría lograr esto? Gracias de antemano.
Valora esta pregunta


0