Partilhar via


Como usar GraphFrames no Azure Databricks

Este artigo inclui blocos de anotações de exemplo para ajudá-lo a começar a usar GraphFrames no Azure Databricks. GraphFrames é um pacote para o Apache Spark que fornece gráficos baseados em DataFrame. Fornece APIs de alto nível em Java, Python e Scala. Ele visa fornecer tanto a funcionalidade do GraphX quanto a funcionalidade estendida aproveitando o Spark DataFrames. Esta funcionalidade alargada inclui localização de temas, serialização baseada no DataFrame e consultas de gráfico altamente expressivas.

Este artigo inclui três blocos de anotações de exemplo: um bloco de anotações introdutório disponível em Python e no Scala e um guia do usuário do Python. Para obter exemplos adicionais usando GraphFrames com Scala, consulte Guia do usuário do GraphFrames - Scala.

Recomendação de tempo de execução do Databricks para GraphFrames

A Databricks recomenda o uso de um cluster executando o Databricks Runtime for Machine Learning, pois inclui uma instalação otimizada do GraphFrames.

Se você não estiver usando um cluster executando o Databricks Runtime ML, baixe o arquivo JAR da biblioteca GraphFrames, carregue-o em um volume e instale-o em seu cluster.

Introdução ao GraphFrames

Os blocos de anotações a seguir mostram como usar GraphFrames para executar a análise de gráficos.

Análise de gráficos com GraphFrames (Python)

Obter de bloco de notas

Análise de gráficos com GraphFrames (Scala)

Obter de bloco de notas

Guia do usuário do GraphFrames (Python)

O bloco de anotações a seguir inclui exemplos de código Python de como usar GraphFrames.

Caderno Python GraphFrames

Obter de bloco de notas