Extrar datos de PDF con Python
Publicado por fabian (3 intervenciones) el 31/08/2021 23:01:23
Hola. Hace rato que estoy tratando de extraer datos dentro de un PDF. No descubro como hacer referencia a algún campo. Llegué hasta extractText() que logro imprimir en pantalla todos los datos de un registro. Necesito tomar una información (ApellidoyNombre) que es el noveno campo y no llego a descubrir cómo hacer referencia a esa información. En esta instrucción pdfData=page1.extractText(), no hay forma de llegar a la info que quiero extraer?
El programa para ver info de PDF es este
import PyPDF2
file=open("AgostoPDF.pdf","rb")
reader=PyPDF2.PdfFileReader(file)
page1=reader.getPage(32)
print(reader.numPages)
pdfData=page1.extractText()
print(pdfData)
La info que me trae es esta
308
15039
2021
Agosto
12.968,05
Aporte Fondo Compensador
-6.264,82
31.764,64
Barcos Roxana Maria
Como hago para extraer: Barcos Roxana Maria
Gracias
El programa para ver info de PDF es este
import PyPDF2
file=open("AgostoPDF.pdf","rb")
reader=PyPDF2.PdfFileReader(file)
page1=reader.getPage(32)
print(reader.numPages)
pdfData=page1.extractText()
print(pdfData)
La info que me trae es esta
308
15039
2021
Agosto
12.968,05
Aporte Fondo Compensador
-6.264,82
31.764,64
Barcos Roxana Maria
Como hago para extraer: Barcos Roxana Maria
Gracias
Valora esta pregunta


0