Databricks 理解您的数据的重要性,并且在您使用我们的平台和 Databricks AI 辅助功能时所给予的信任。 Databricks 致力于最高数据保护标准,并实施了严格的措施,以确保提交到 Databricks AI 辅助功能的信息受到保护。
-
你的数据仍然保密。
- Databricks 不会使用您提交到这些功能中的数据来训练生成基础模型。同时,Databricks 也不会使用这些数据来为其他客户生成建议。
- 我们的模型合作伙伴不会保留通过这些功能提交的数据,即使用于滥用监视。 我们的合作伙伴支持的 AI 辅助功能使用模型合作伙伴提供的零数据保留终结点。
- 防止有害输出。 使用 Azure Open AI 时,Databricks 还使用 Azure OpenAI 内容筛选 来保护用户免受有害内容的影响。 此外,Databricks 还对数千个模拟用户交互进行了广泛评估,以确保为防止有害内容、破解操作、不安全代码生成和第三方版权内容使用而实施的保护是有效的。
- Databricks 仅使用为了提供服务而所需的数据。 仅当与 Databricks AI 辅助功能交互时,才会发送数据。 Databricks 发送提示、相关的表元数据和值、错误以及输入代码或查询,以帮助返回更相关的结果。
- Databricks 不会使用提交到这些功能的数据、提示或响应来训练生成基础模型。 Databricks 不会使用这些数据来生成显示给其他客户的建议。
- 保护正在传输的数据和静态数据。 Databricks 和模型合作伙伴之间的所有流量都使用行业标准 TLS 加密在传输中加密。 Azure Databricks 工作区中存储的所有数据都会经过 AES-256 位加密。
- Databricks 提供数据驻留控制。 Databricks AI 辅助功能属于指定服务,并符合数据驻留边界要求。 有关详细信息,请参阅 Databricks 地理位置:数据驻留和 Databricks 指定服务。
若要了解 Databricks 助手隐私,请参阅 隐私和安全常见问题解答。
隐私和安全常见问题解答
合作伙伴支持的 AI 辅助功能使用哪些服务和模型?
如果启用了 合作伙伴支持的 AI 功能 设置,Databricks AI 辅助功能将使用由 Azure OpenAI 服务或 Anthropic 托管的模型。 如果禁用 合作伙伴支持的 AI 功能 设置,某些 AI 辅助功能可能会使用 Databricks 托管的模型。 有关详细信息,请参阅 合作伙伴支持的 AI 功能。
向模型发送哪些数据?
Databricks 仅发送提供服务所需的数据,这可能因每个功能而异。
Databricks 助手 将提示(例如问题或代码)以及相关元数据发送到支持每个 API 请求的功能的模型。 这有助于为数据返回更相关的结果。 示例包括:
- 当前笔记本单元格或 SQL 编辑器选项卡中的代码和查询
- 表和列的名称和说明
- 以前的问题
- 收藏表
助手代理模式(现为 Beta 版)还可以分析单元格输出并从表中读取数据样本,类似于行业中的其他编码代理。
Genie 在生成响应时使用提示、相关的表元数据和值、错误以及输入代码或查询。
为了处理响应,Genie 使用以下方法:
- 用户提交的自然语言提示
- 表名称和说明
- 相关值
- 一般指引
- 示例 SQL 查询
- SQL 函数
对于 AI 生成的注释,Databricks 使用每个 API 请求将以下元数据发送到模型:
- 目录(目录名称、当前批注、目录类型)
- 架构(目录名称、架构名称、当前注释)
- 表(目录名称、架构名称、表名、当前注释)
- 函数(目录名称、架构名称、函数名称、当前注释、参数、定义)
- 模型(目录名称、架构名称、模型名称、当前注释、别名)
- 卷(目录名称、架构名称、卷名称、当前注释)
- 列名(列名、类型、主键或否、当前列注释)
合作伙伴模型提供程序是否存储我的数据?
否。 通过 Databricks 使用合作伙伴模型时,合作伙伴模型提供程序不会存储提示或响应。
AI 辅助功能的响应存储在何处?
Genie 响应和已批准的 AI 生成评论存储在 Databricks 控制平面数据库中。 控制平面数据库是 AES-256 位加密的。
助理聊天历史记录与其他 笔记本内容存储在同一位置。
发送到模型的数据是否尊重用户的 Unity 目录权限?
是的,发送到 AI 辅助功能模型的所有数据均遵循 Unity 目录权限,因此无法访问数据的用户也不会将该数据发送到此类模型。
其他用户是否可以使用助手或 Genie 查看我的聊天历史记录?
与助手的交互仅对启动交互的用户可见。
Genie 空间管理器可以查看其他用户的消息,但看不到其查询结果。
Genie 还是 Databricks 助手执行代码?
Genie 设计为对客户数据的只读访问权限,因此只能生成和运行只读 SQL 查询。
使用代理模式,助手可以在笔记本和 SQL 编辑器中运行代码。 首先,助理将要求你确认继续执行。 可以选择确认、始终允许在当前助手线程中执行或始终允许执行。 其他助手模式不会代表你自动运行代码。
AI 模型可能会犯错误、误解意图、产生幻觉或给出不正确的答案。 运行 AI 生成的代码之前,请查看并测试它。
Databricks 是否进行了任何评估来评估 AI 辅助功能响应的准确性和适当性?
是的,Databricks 根据预期用例和使用模拟用户输入,对我们所有的 AI 辅助功能进行了广泛的测试,以提高响应的准确性和适当性。 也就是说,生成式 AI 是一种新兴技术,AI 辅助功能可能会提供不准确或不当的反应。
是否可以对处理受管制数据的表使用 AI 辅助功能(PHI、PCI、IRAP、FedRAMP)?
是的。 要这样做,你必须符合启用合规性安全配置文件等要求,并将相关合规性标准添加为合规性安全配置文件配置的一部分。
我的流量如何通过 Geos 路由?
Databricks AI 辅助功能是 指定服务 ,这些服务使用 Databricks Geos 管理处理客户内容时的数据驻留。 流量路由取决于你的区域以及是否启用了 跨地理位置处理 (已禁用 指定服务的工作区地理位置内的强制数据处理 )。
AI 辅助功能如何适用于 Databricks 托管的模型?
当 Databricks AI 辅助功能使用 Databricks 托管的模型时,它们使用 OpenAI GPT OSS 或其他可用于商业用途的模型。 请参阅 有关授权和使用生成 AI 模型的信息。
下图概述了 Databricks 托管的模型如何为 Databricks AI 支持的功能(如快速修复)提供支持。
- 用户执行笔记本单元格,这会导致错误。
- Databricks 将元数据附加到请求,并将其发送到 Databricks 托管的大型语言模型(LLM)。 所有数据在静止状态下加密。 客户可以使用客户管理的密钥(CMK)。
- Databricks 托管的模型使用建议的代码编辑进行响应,以修复向用户显示的错误。