1. Vamos aprender nessa aula a extrair imagens de um arquivo pdf. Vamos adicionar o código em uma função dentro do módulo que criamos na aula anterior.
  2. Pensando nisso, no arquivo pdf_operations.py vamos criar o código abaixo.
import PyPDF2 as pdf
from PyPDF2 import PdfReader

def extract_images_from_pdf(pdf_path):
    with open(pdf_path, "rb") as f:
        reader = PdfReader(f)
        for page_num in range(0, len(reader.pages)):
            selected_page = reader.pages[page_num]
            for img_file_obj in selected_page.images:
                with open(f"files/{img_file_obj.name}", "wb") as out:
                    out.write(img_file_obj.data)

extract_images_from_pdf("files/test_pdf_image.pdf")
  1. Para executar o arquivo execute o comando python .\pdf_operations.py

Img1.png

Img2.png