vector-search-indexes 命令组

Note

此信息适用于 Databricks CLI 版本 0.205 及更高版本。 Databricks CLI 目前处于公共预览阶段。

Databricks CLI 的使用须遵守 Databricks 许可Databricks 隐私声明,包括任何数据使用规定。

vector-search-indexes Databricks CLI 中的命令组包含用于管理矢量搜索索引的命令。 矢量搜索索引是嵌入矢量的有效表示形式,支持实时和近似近邻(ANN)搜索查询。 请参阅 Mosaic AI 矢量搜索

databricks 向量搜索索引 创建索引

创建新索引。

databricks vector-search-indexes create-index NAME ENDPOINT_NAME PRIMARY_KEY INDEX_TYPE [flags]

Arguments

NAME

    索引的名称。

ENDPOINT_NAME

    要用于提供索引的终结点的名称

PRIMARY_KEY

    索引的主键

INDEX_TYPE

    有两种类型的矢量搜索索引:增量同步(自动与源 Delta 表同步的索引)或直接访问(支持直接读取和写入矢量和元数据的索引)。 支持的值:DELTA_SYNCDIRECT_ACCESS

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

全局标志

Examples

以下示例创建新的 Delta Sync 索引:

databricks vector-search-indexes create-index my-index my-endpoint id DELTA_SYNC

以下示例创建新的 Direct Access 索引:

databricks vector-search-indexes create-index my-index my-endpoint id DIRECT_ACCESS

Databricks 向量搜索索引删除数据向量索引

从索引中删除数据。

databricks vector-search-indexes delete-data-vector-index INDEX_NAME [flags]

Arguments

INDEX_NAME

    要删除数据的向量索引的名称。 必须是直接矢量访问索引。

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

全局标志

Examples

以下示例从直接矢量访问索引中删除数据:

databricks vector-search-indexes delete-data-vector-index my-index --json '{"primary_keys": ["key1", "key2"]}'

Databricks 向量搜索索引 删除索引

删除索引。

databricks vector-search-indexes delete-index INDEX_NAME [flags]

Arguments

INDEX_NAME

    索引的名称。

选项

全局标志

Examples

以下示例删除矢量搜索索引:

databricks vector-search-indexes delete-index my-index

Databricks 向量搜索索引 获取索引

获取索引。

databricks vector-search-indexes get-index INDEX_NAME [flags]

Arguments

INDEX_NAME

    索引的名称。

选项

全局标志

Examples

以下示例获取矢量搜索索引的详细信息:

databricks vector-search-indexes get-index my-index

databricks 向量搜索索引 列出索引

列出索引。

databricks vector-search-indexes list-indexes ENDPOINT_NAME [flags]

Arguments

ENDPOINT_NAME

    终结点的名称

选项

--page-token string

    分页用的令牌

全局标志

Examples

以下示例列出终结点中的所有索引:

databricks vector-search-indexes list-indexes my-endpoint

以下示例使用分页列出索引:

databricks vector-search-indexes list-indexes my-endpoint --page-token next-page-token

Databricks 向量搜索索引查询索引

查询索引。

databricks vector-search-indexes query-index INDEX_NAME [flags]

Arguments

INDEX_NAME

    要查询的向量索引的名称

选项

--filters-json string

    表示查询筛选器的 JSON 字符串

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--num-results int

    要返回的结果数

--query-text string

    查询文本

--query-type string

    要使用的查询类型

--score-threshold float

    近似最近邻搜索的阈值

全局标志

Examples

以下示例使用文本查询索引:

databricks vector-search-indexes query-index my-index --query-text "search term" --num-results 10

以下示例使用筛选器查询索引:

databricks vector-search-indexes query-index my-index --query-text "search term" --filters-json '{"category": "product"}' --num-results 5

databricks 的 vector-search-indexes 查询下一页

查询下一页。

databricks vector-search-indexes query-next-page INDEX_NAME [flags]

Arguments

INDEX_NAME

    要查询的向量索引的名称

选项

--endpoint-name string

    终结点的名称

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--page-token string

    从之前的 QueryVectorIndex 或 QueryVectorIndexNextPage API 返回的页令牌

全局标志

Examples

以下示例查询下一页结果:

databricks vector-search-indexes query-next-page my-index --endpoint-name my-endpoint --page-token "next-page-token"

databricks 向量搜索索引 扫描索引

扫描索引。

databricks vector-search-indexes scan-index INDEX_NAME [flags]

Arguments

INDEX_NAME

    要扫描的矢量索引的名称

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

--last-primary-key string

    上一次扫描中返回的最后一个条目的主键

--num-results int

    要返回的结果数

全局标志

Examples

以下示例扫描索引:

databricks vector-search-indexes scan-index my-index --num-results 100

以下示例从特定键开始扫描索引:

databricks vector-search-indexes scan-index my-index --last-primary-key "key123" --num-results 100

databricks 向量搜索索引 同步索引

同步索引。

databricks vector-search-indexes sync-index INDEX_NAME [flags]

Arguments

INDEX_NAME

    要同步的向量索引的名称。 必须是增量同步索引。

选项

全局标志

Examples

以下示例触发增量同步索引的同步:

databricks vector-search-indexes sync-index my-delta-sync-index

Databricks 数字搜索索引 插入更新数据向量索引

将数据插入或更新到索引中。

databricks vector-search-indexes upsert-data-vector-index INDEX_NAME INPUTS_JSON [flags]

Arguments

INDEX_NAME

    要插入数据的向量索引的名称。 必须是直接矢量访问索引。

INPUTS_JSON

    表示要插入的数据的 JSON 字符串

选项

--json JSON

    包含请求正文的内联 JSON 字符串或 @path 到 JSON 文件。

全局标志

Examples

以下示例将数据向上插入到直接矢量访问索引中:

databricks vector-search-indexes upsert-data-vector-index my-index '{"vectors": [{"id": "1", "vector": [0.1, 0.2, 0.3], "metadata": {"title": "Document 1"}}]}'

全局标志

--debug

  是否启用调试日志记录。

-h--help

    显示 Databricks CLI、相关命令组或相关命令的帮助。

--log-file 字符串

    一个字符串,表示要将输出日志写入到的文件。 如果未指定此标志,则默认会将输出日志写入到 stderr。

--log-format 格式

    日志格式类型,textjson。 默认值是 text

--log-level 字符串

    一个表示日志格式级别的字符串。 如果未指定,则禁用日志格式级别。

-o, --output 类型

    命令输出类型为textjson。 默认值是 text

-p, --profile 字符串

     ~/.databrickscfg 文件中用于运行命令的配置文件的名称。 如果未指定此标志,则如果存在,将使用名为 DEFAULT 的配置文件。

--progress-format 格式

    显示进度日志的格式: defaultappendinplacejson

-t, --target 字符串

    如适用,要使用的捆绑包目标