- Vamos aprender nessa aula a importar e extrair informação de um PDF com a linguagem Python.
- Podemos utilizar algumas automações com PDF, a imagem a seguir sugere algumas possibilidades:

- Para começar, vamos importar um arquivo PDF e fazer a leitura dele. Pensando nisso, vamos criar o arquivo 18-pdf.py
import PyPDF2 as pdf
from PyPDF2 import PdfReader, PdfWriter
# 1 - Versão e Métodos da Lib
print(pdf.__version__)
print(dir(pdf))
# 2 - Importando arquivo PDF
file = open("files/sample.pdf", "rb")
reader = PdfReader(file)
print(reader)
print(reader.metadata)
info = reader.metadata
# 3 - Extraindo algumas informações
print(info.title)
print(info.author)
print(info.creator)
print(info.subject)
print(len(reader.pages))
print(reader.pages[0].extract_text())
- Para executar o arquivo execute o comando python .\18-pdf.py
