- Nessa aula vamos conhecer a biblioteca BeatifulSoup para extrair vagas em Python diretamente de uma página web.
- Pensando nisso, vamos criar o arquivo 8-req_bsoup.py.
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 1 - Coletando Vagas Python
html_text = requests.get('<https://www.timesjobs.com/candidate/job-search.html?searchType=personalizedSearch&from=submit&txtKeywords=python&txtLocation=>').text
# print(html_text)
soup = BeautifulSoup(html_text, 'lxml')
jobs = soup.find_all('li', class_='clearfix job-bx wht-shd-bx')
print(jobs[:3])
print(len(jobs))
# 2 - Estruturando informações
for job in jobs[:20]:
name_company = job.find('h3', class_='joblist-comp-name').text.replace(' ', '')
skill = job.find('span', class_='srp-skills').text.replace(' ', '')
published_date = job.find('span', class_='sim-posted').span.text[7:]
print(name_company.strip())
print(skill)
print(published_date)
- Para executar o arquivo, podemos executar o comando python .\8-req_bsoup.py.
