
Web Scrapping en vivo
Publicado por Agustin (1 intervención) el 01/11/2022 11:49:49
buenas, como les va? soy nuevo en este mundo de python (si bien conozco algo de programacion) y estoy trabajando en un projecto:
Mi idea es recopilar datos en vivo de una web, y guardarlos en un excel (esta etapa todavía no inicié). En principio pude hacer un código muy básico que sacaba datos de unas tablas, y lo recorría con un for para los distintos datos.
Ahora, al probar con los datos en "vivo", no estoy pudiendo leer el texto. Entiendo que estoy buscando de manera equivocada, pero no estoy encontrando el problema. La página es: http://apat.realtime.com.ar/ Los datos que estoy tratando de obtener en principio son los de vta: 3.
Lo que está comentado es lo de sacar datos de otra tabla.
Mi idea es recopilar datos en vivo de una web, y guardarlos en un excel (esta etapa todavía no inicié). En principio pude hacer un código muy básico que sacaba datos de unas tablas, y lo recorría con un for para los distintos datos.
Ahora, al probar con los datos en "vivo", no estoy pudiendo leer el texto. Entiendo que estoy buscando de manera equivocada, pero no estoy encontrando el problema. La página es: http://apat.realtime.com.ar/ Los datos que estoy tratando de obtener en principio son los de vta: 3.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36'}
URL = 'http://apat.realtime.com.ar/'
r = requests.get(URL)
soup = BeautifulSoup(r.text, 'html.parser')
#coleccion = [0,1,2,3,5]
#for e in coleccion:
# posicion = soup.find('div', {'class':'table-responsive generic-tbl championship-tbl'}).find_all('td')[e].text
# print(posicion)
posicion = soup.find('div', {'class':'table-responsive'}).find_all('span')[0]
#numero = soup.find('div', {'class':'table-responsive generic-tbl championship-tbl'}).find_all('td')[1].text
#nombre = soup.find('div', {'class':'table-responsive generic-tbl championship-tbl'}).find_all('td')[2].text
#ganadas = soup.find('div', {'class':'table-responsive generic-tbl championship-tbl'}).find_all('td')[3].text
#puntos = soup.find('div', {'class':'table-responsive generic-tbl championship-tbl'}).find_all('td')[5].text
print(posicion)
Lo que está comentado es lo de sacar datos de otra tabla.
Valora esta pregunta


0