1. Nessa aula vamos consolidar o conhecimento que aprendemos até aqui sobre o MongoDB e vamos importar dados de um dataset.
  2. Vamos utilizar o dataset Nobel Prize que pode ser encontrado nesse link: https://api.nobelprize.org/v1/prize.json

Img1.png

  1. Como podemos ver, o dataset possui a informação do prêmio Nobel e dos vencedores (laureados). Com esse objetivo, teremos uma coleção para armazenar cada uma dessas informações.
  2. Para isso, vamos criar o arquivo nobel_project.py para realizar a ingestão dos dados dessa API no MongoDB.
import requests
from pymongo import MongoClient

# 1 - Estabelece conexão com o MongoDB e database
client = MongoClient()

db = client['nobel']

# 2 - Ingestão dos Dados em Documentos
for collection_name in ["prizes", "laureates"]:
    response = requests.get(
        f"<http://api.nobelprize.org/v1/{collection_name[:-1]}.json>")
    documents = response.json()[collection_name]
    
    db[collection_name].insert_many(documents)
    
# 3 - Acessando coleções / Conta documentos na coleção
prizes = db["prizes"]
laureates = db["laureates"]

len_prizes = prizes.count_documents({})
len_laureates = laureates.count_documents({})

print(len_prizes)
print(len_laureates)
  1. Para executar o arquivo temos que executar o comando python .\nobel_project.py.py.

Img2.png

Img3.png