適用対象:
Databricks SQL
Databricks Runtime
重要
この機能は 、パブリック プレビュー と HIPAA に準拠しています。
プレビュー期間中:
- 基になる言語モデルでは複数の言語を処理できますが、この AI 関数は英語用にチューニングされています。
- AI Functionsの地域可用性については、地域限定の機能を参照してください。
ai_similarity()関数は、Databricks Foundation Model API から最先端の生成 AI モデルを呼び出して、2 つの文字列を比較し、SQL を使用してセマンティック類似性スコアを計算します。
要件
重要
現時点で使用される可能性のある基になるモデルは、 Apache 2.0 ライセンス、Copyright © The Apache Software Foundation または LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. に基づきライセンスされます。すべての権限が予約されています。 お客様は、該当するモデル ライセンスへのコンプライアンスを遵守する責任を負います。
Databricks では、該当する使用条件に準拠するために、これらのライセンスを確認することをお勧めしています。 Databricks の内部ベンチマークに従ってパフォーマンスが向上するモデルが将来出現した場合、Databricks によってモデルが変更される可能性があります (および、このページで提供されている該当するライセンスの一覧)。
- この関数は、 バッチ推論用に最適化された AI Functions をサポートするリージョン内のワークスペースでのみ使用できます。
- この関数は、Azure Databricks SQL クラシックでは使用できません。
- Databricks SQL の価格ページを確認します。
- Databricks Runtime 15.1 以上では、この関数は Databricks ノートブック内でサポートされ、これには Databricks ワークフロー内でタスクとして実行されるノートブックも含まれます。
- バッチ推論ワークロードでは、パフォーマンスを向上させるために Databricks Runtime 15.4 ML LTS が必要です。
構文
ai_similarity(expr1, expr2)
引数
-
expr1:STRING式。 -
expr2:STRING式。
返品ポリシー
2 つの入力文字列間のセマンティック類似性を表す FLOAT 値。 出力スコアは相対的なものであり、ランク付けにのみに使用してください。 スコア 1 は、2 つのテキストが等しいことを意味します。
例
> SELECT ai_similarity('Apache Spark', 'Apache Spark');
1.0
> SELECT
company_name
FROM
customers
ORDER BY ai_similarity(company_name, 'Databricks') DESC
LIMIT 10;
Databricks Inc.