Compartilhar via


Função ai_summarize

Aplica-se a:com marcação de verificação sim Databricks SQL verificação marcada como sim Databricks Runtime

Importante

Essa funcionalidade está em conformidade com a Versão Prévia Pública e com HIPAA.

Durante a visualização:

A função ai_summarize() permite invocar um modelo de IA generativo de última geração para gerar um resumo de um determinado texto usando SQL. Essa função usa um ponto de extremidade de atendimento do modelo de chat disponibilizado pelas APIs dos Modelos de Base do Databricks.

Requisitos

Importante

Os modelos subjacentes que podem ser usados no momento são licenciados sob a Licença Apache 2.0 , Copyright © The Apache Software Foundation ou a Licença de Comunidade LLAMA 3.3 , Copyright © Meta Platforms, Inc. Todos os direitos reservados. Os clientes são responsáveis por garantir a conformidade com as licenças de modelo aplicáveis.

O Databricks recomenda revisar essas licenças para garantir a conformidade com quaisquer termos aplicáveis. Se surgirem modelos no futuro com melhor desempenho de acordo com os parâmetros de comparação internos do Databricks, o Databricks poderá alterar o modelo (e a lista de licenças aplicáveis fornecidas nesta página).

Sintaxe

ai_summarize(content[, max_words])

Argumentos

  • content: Uma STRING expressão, o texto a ser resumido.
  • max_words: Uma expressão numérica integral não negativa opcional que representa o número alvo de palavras de melhor esforço no texto de resumo retornado. O valor padrão é 50. Se definido como 0, não há limite de palavras.

Retornos

Um STRING.

Se content for NULL, o resultado é NULL.

Exemplos

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  );
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."