Freigeben über


ai_extract-Funktion

Gilt für:durch Häkchen mit „Ja“ markiert Databricks SQL durch Häkchen mit „Ja“ markiert Databricks Runtime

Wichtig

Diese Funktionalität ist in public Preview und HIPAA kompatibel.

Während der Vorschau:

Mit der ai_extract()-Funktion können Sie ein hochmodernes Modell für generative KI aufrufen, um Entitäten zu extrahieren, die mithilfe von SQL durch Bezeichnungen aus einem bestimmten Text angegeben wurden. Diese Funktion verwendet einen Bereitstellungsendpunkt für Chatmodelle, der durch die Basismodell-APIs von Databricks verfügbar gemacht wird.

Anforderungen

Wichtig

Die zugrunde liegenden Modelle, die derzeit verwendet werden können, werden unter der Apache 2.0 License, Copyright © The Apache Software Foundation oder der LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. lizenziert. Alle Rechte vorbehalten. Kunden sind dafür verantwortlich, die Einhaltung anwendbarer Modelllizenzen sicherzustellen.

Databricks empfiehlt, diese Lizenzen zu überprüfen, um die Einhaltung der geltenden Bedingungen zu gewährleisten. Wenn in Zukunft Modelle entstehen, die gemäß den internen Benchmarks von Databricks besser funktionieren, kann Databricks das Modell (und die Liste der anwendbaren Lizenzen auf dieser Seite) ändern.

  • Diese Funktion ist nur für Arbeitsbereiche in Regionen verfügbar, die KI-Funktionen unterstützen, die für die Batch-Ableitung optimiert sind.
  • Diese Funktion ist in Azure Databricks SQL Classic nicht verfügbar.
  • Weitere Informationen finden Sie auf der Seite zu den Preisen von Databricks SQL.
  • In Databricks Runtime 15.1 und höher wird diese Funktion in Databricks-Notebooks unterstützt, einschließlich in Notebooks, die als Task in einem Databricks-Workflow ausgeführt werden.
  • Batch-Ableitungsworkloads erfordern Databricks Runtime 15.4 ML LTS für eine verbesserte Leistung.

Hinweis

In Databricks Runtime 15.1 und höher wird diese Funktion in Databricks-Notebooks unterstützt, einschließlich in Notebooks, die als Task in einem Databricks-Workflow ausgeführt werden.

Syntax

ai_extract(content, labels)

Argumente

  • content: Ein STRING-Ausdruck.
  • labels: Ein ARRAY<STRING>-Literal. Jedes Element ist ein Entitätstyp, der extrahiert werden soll.

Rückgabe

Ein STRUCT-Ausdruck, bei dem jedes Feld einem in labels angegebenen Entitätstyp entspricht. Jedes Feld enthält eine Zeichenfolge, die die extrahierte Entität darstellt. Wenn mehr als ein Kandidat für einen Entitätstyp gefunden wird, wird nur einer zurückgegeben.

Wenn es contentNULL ist, ist das Ergebnis NULL.

Beispiele

> SELECT ai_extract(
    'John Doe lives in New York and works for Acme Corp.',
    array('person', 'location', 'organization')
  );
 {"person": "John Doe", "location": "New York", "organization": "Acme Corp."}

> SELECT ai_extract(
    'Send an email to jane.doe@example.com about the meeting at 10am.',
    array('email', 'time')
  );
 {"email": "jane.doe@example.com", "time": "10am"}