Tutorial: Consultar e visualizar dados de um notebook

Este tutorial explica como usar um notebook do Azure Databricks para consultar dados de exemplo armazenados no Catálogo do Unity usando SQL, Python, Scala e R e visualizar os resultados da consulta no notebook.

Requisitos

Para concluir as tarefas neste artigo, você deve atender aos seguintes requisitos:

Seu espaço de trabalho deve ter o Catálogo do Unity habilitado. Para obter informações sobre como começar a usar o Catálogo do Unity, consulte Introdução ao Catálogo do Unity.
Você deve ter permissão para usar um recurso de computação existente ou criar um recurso de computação. Consulte Computação ou consulte o administrador do Databricks.

Etapa 1: Criar um notebook

Para criar um bloco de notas na sua área de trabalho, clique em Novo na barra lateral e, em seguida, clique em Notebook. Um notebook em branco é aberto no workspace.

Para saber mais sobre como criar e gerenciar notebooks, consulte Gerenciar notebooks.

Etapa 2: Consultar uma tabela

Consulte a tabela samples.nyctaxi.trips no Catálogo do Unity usando o idioma de sua preferência.

Copie e cole o código a seguir na nova célula vazia do notebook. Esse código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Catálogo do Unity.

SQL

SELECT * FROM samples.nyctaxi.trips

Python

display(spark.read.table("samples.nyctaxi.trips"))

Scala (linguagem de programação)

display(spark.read.table("samples.nyctaxi.trips"))

R

library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))

Pressione Shift+Enter para executar a célula e depois mova para a próxima célula.

Os resultados da consulta aparecem no notebook.

Etapa 3: Exibir os dados

Exiba o valor da tarifa média por distância de viagem, agrupada pelo código postal da coleta.

Ao lado da guia Tabela, clique + e, em seguida, clique em Visualização.

O editor de visualização é exibido.
Na lista suspensa Tipo de Visualização, verifique se a Barra está selecionada.
Selecione fare_amount para a coluna X.
Selecione trip_distance para a coluna Y.
Selecione Average como o tipo de agregação.
Selecione pickup_zip como a coluna Agrupar por.
Clique em Save (Salvar).

Próximas etapas

Para saber mais sobre como adicionar dados do arquivo CSV ao Catálogo do Unity e visualizar dados, consulte Tutorial: Importar e visualizar dados CSV de um notebook.
Para saber como carregar dados no Databricks usando o Apache Spark, consulte Tutorial: Carregar e transformar dados usando o Apache Spark DataFrames.
Para saber mais sobre como ingerir dados no Databricks, consulte conectores Standard no Lakeflow Connect.
Para saber mais sobre como consultar dados com o Databricks, consulte Dados de consulta.
Para saber mais sobre visualizações, consulte Visualizações nos notebooks do Databricks e no editor de SQL.
Para saber mais sobre técnicas exploratórias de análise de dados (EDA), consulte Tutorial: técnicas de EDA usando notebooks do Databricks.

Comentários

Esta página foi útil?

Last updated on 2025-11-13