Extrayendo datos de una Web.
Publicado por Anikollaste (118 intervenciones) el 06/10/2020 19:14:57
Hola a todos!!
Como resultado de la extracción de direcciones de una web, he obtenido una lista, pero cada elemento de la lista consta de mas información de la que quiero y no sé cómo filtrarlo:
Ejemplo de un elemento de la lista:
'calle baja, 12, 14815, fuente tojar cordoba, cordoba'
Quiero extraer desde 'calle' hasta la primera coma ',' y me he quedado totalmente bloqueado.
Esta es la salida de datos:

Como resultado de la extracción de direcciones de una web, he obtenido una lista, pero cada elemento de la lista consta de mas información de la que quiero y no sé cómo filtrarlo:
Ejemplo de un elemento de la lista:
'calle baja, 12, 14815, fuente tojar cordoba, cordoba'
Quiero extraer desde 'calle' hasta la primera coma ',' y me he quedado totalmente bloqueado.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import requests
from bs4 import BeautifulSoup
url='https://empresite.eleconomista.es/Actividad/TRANSPORTES/provincia/CORDOBA/'
def extraerDatos(web):
pagina=requests.get(url)
soup=BeautifulSoup(pagina.content, 'html.parser')
#Buascar todas las direcciones con la etiquetas 'a' de la clase "a_directorio"
direcciones=soup.find_all('span',class_="bold text-capitalize")
return direcciones
calles=[]
for i in extraerDatos(url):
calles.append(i.text)
print(calles)

Valora esta pregunta


0