1. Nessa aula vamos conhecer a biblioteca BeatifulSoup para extrair vagas em Python diretamente de uma página web.
  2. Pensando nisso, vamos criar o arquivo 8-req_bsoup.py.
import requests
from bs4 import BeautifulSoup
import pandas as pd

# 1 - Coletando Vagas Python
html_text = requests.get('<https://www.timesjobs.com/candidate/job-search.html?searchType=personalizedSearch&from=submit&txtKeywords=python&txtLocation=>').text
# print(html_text)
soup = BeautifulSoup(html_text, 'lxml')
jobs = soup.find_all('li', class_='clearfix job-bx wht-shd-bx')
print(jobs[:3])
print(len(jobs))

# 2 - Estruturando informações
for job in jobs[:20]:
    name_company = job.find('h3', class_='joblist-comp-name').text.replace(' ', '')
    skill = job.find('span', class_='srp-skills').text.replace(' ', '')
    published_date = job.find('span', class_='sim-posted').span.text[7:]
    print(name_company.strip())
    print(skill)
    print(published_date)
  1. Para executar o arquivo, podemos executar o comando python .\8-req_bsoup.py.

Img2.png