Note
此信息适用于 Databricks CLI 版本 0.205 及更高版本。 Databricks CLI 目前处于公共预览阶段。
Databricks CLI 的使用须遵守 Databricks 许可和 Databricks 隐私声明,包括任何数据使用规定。
vector-search-indexes
Databricks CLI 中的命令组包含用于管理矢量搜索索引的命令。 矢量搜索索引是嵌入矢量的有效表示形式,支持实时和近似近邻(ANN)搜索查询。 请参阅 Mosaic AI 矢量搜索。
databricks 向量搜索索引 创建索引
创建新索引。
databricks vector-search-indexes create-index NAME ENDPOINT_NAME PRIMARY_KEY INDEX_TYPE [flags]
Arguments
NAME
索引的名称。
ENDPOINT_NAME
要用于提供索引的终结点的名称
PRIMARY_KEY
索引的主键
INDEX_TYPE
有两种类型的矢量搜索索引:增量同步(自动与源 Delta 表同步的索引)或直接访问(支持直接读取和写入矢量和元数据的索引)。 支持的值:DELTA_SYNC、DIRECT_ACCESS
选项
--json JSON
包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。
Examples
以下示例创建新的 Delta Sync 索引:
databricks vector-search-indexes create-index my-index my-endpoint id DELTA_SYNC
以下示例创建新的 Direct Access 索引:
databricks vector-search-indexes create-index my-index my-endpoint id DIRECT_ACCESS
Databricks 向量搜索索引删除数据向量索引
从索引中删除数据。
databricks vector-search-indexes delete-data-vector-index INDEX_NAME [flags]
Arguments
INDEX_NAME
要删除数据的向量索引的名称。 必须是直接矢量访问索引。
选项
--json JSON
包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。
Examples
以下示例从直接矢量访问索引中删除数据:
databricks vector-search-indexes delete-data-vector-index my-index --json '{"primary_keys": ["key1", "key2"]}'
Databricks 向量搜索索引 删除索引
删除索引。
databricks vector-search-indexes delete-index INDEX_NAME [flags]
Arguments
INDEX_NAME
索引的名称。
选项
Examples
以下示例删除矢量搜索索引:
databricks vector-search-indexes delete-index my-index
Databricks 向量搜索索引 获取索引
获取索引。
databricks vector-search-indexes get-index INDEX_NAME [flags]
Arguments
INDEX_NAME
索引的名称。
选项
Examples
以下示例获取矢量搜索索引的详细信息:
databricks vector-search-indexes get-index my-index
databricks 向量搜索索引 列出索引
列出索引。
databricks vector-search-indexes list-indexes ENDPOINT_NAME [flags]
Arguments
ENDPOINT_NAME
终结点的名称
选项
--page-token string
分页用的令牌
Examples
以下示例列出终结点中的所有索引:
databricks vector-search-indexes list-indexes my-endpoint
以下示例使用分页列出索引:
databricks vector-search-indexes list-indexes my-endpoint --page-token next-page-token
Databricks 向量搜索索引查询索引
查询索引。
databricks vector-search-indexes query-index INDEX_NAME [flags]
Arguments
INDEX_NAME
要查询的向量索引的名称
选项
--filters-json string
表示查询筛选器的 JSON 字符串
--json JSON
包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。
--num-results int
要返回的结果数
--query-text string
查询文本
--query-type string
要使用的查询类型
--score-threshold float
近似最近邻搜索的阈值
Examples
以下示例使用文本查询索引:
databricks vector-search-indexes query-index my-index --query-text "search term" --num-results 10
以下示例使用筛选器查询索引:
databricks vector-search-indexes query-index my-index --query-text "search term" --filters-json '{"category": "product"}' --num-results 5
databricks 的 vector-search-indexes 查询下一页
查询下一页。
databricks vector-search-indexes query-next-page INDEX_NAME [flags]
Arguments
INDEX_NAME
要查询的向量索引的名称
选项
--endpoint-name string
终结点的名称
--json JSON
包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。
--page-token string
从之前的 QueryVectorIndex 或 QueryVectorIndexNextPage API 返回的页令牌
Examples
以下示例查询下一页结果:
databricks vector-search-indexes query-next-page my-index --endpoint-name my-endpoint --page-token "next-page-token"
databricks 向量搜索索引 扫描索引
扫描索引。
databricks vector-search-indexes scan-index INDEX_NAME [flags]
Arguments
INDEX_NAME
要扫描的矢量索引的名称
选项
--json JSON
包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。
--last-primary-key string
上一次扫描中返回的最后一个条目的主键
--num-results int
要返回的结果数
Examples
以下示例扫描索引:
databricks vector-search-indexes scan-index my-index --num-results 100
以下示例从特定键开始扫描索引:
databricks vector-search-indexes scan-index my-index --last-primary-key "key123" --num-results 100
databricks 向量搜索索引 同步索引
同步索引。
databricks vector-search-indexes sync-index INDEX_NAME [flags]
Arguments
INDEX_NAME
要同步的向量索引的名称。 必须是增量同步索引。
选项
Examples
以下示例触发增量同步索引的同步:
databricks vector-search-indexes sync-index my-delta-sync-index
Databricks 数字搜索索引 插入更新数据向量索引
将数据插入或更新到索引中。
databricks vector-search-indexes upsert-data-vector-index INDEX_NAME INPUTS_JSON [flags]
Arguments
INDEX_NAME
要插入数据的向量索引的名称。 必须是直接矢量访问索引。
INPUTS_JSON
表示要插入的数据的 JSON 字符串
选项
--json JSON
包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。
Examples
以下示例将数据向上插入到直接矢量访问索引中:
databricks vector-search-indexes upsert-data-vector-index my-index '{"vectors": [{"id": "1", "vector": [0.1, 0.2, 0.3], "metadata": {"title": "Document 1"}}]}'
全局标志
--debug
是否启用调试日志记录。
-h 或 --help
显示 Databricks CLI、相关命令组或相关命令的帮助。
--log-file 字符串
一个字符串,表示要将输出日志写入到的文件。 如果未指定此标志,则默认会将输出日志写入到 stderr。
--log-format 格式
日志格式类型,text 或 json。 默认值是 text。
--log-level 字符串
一个表示日志格式级别的字符串。 如果未指定,则禁用日志格式级别。
-o, --output 类型
命令输出类型为text或json。 默认值是 text。
-p, --profile 字符串
~/.databrickscfg 文件中用于运行命令的配置文件的名称。 如果未指定此标志,则如果存在,将使用名为 DEFAULT 的配置文件。
--progress-format 格式
显示进度日志的格式: default、 append、 inplace或 json
-t, --target 字符串
如适用,要使用的捆绑包目标