Important
OneLake 快捷方式的 AI 转换功能目前正处于 公共预览版。 在正式发布之前,功能和行为可能会更改。
新式数据湖充满了原始、非结构化文本、产品评论、支持电子邮件、IoT 设备日志等。 将文本转换为可作的见解通常需要自定义代码、业务流程管道和持续维护。 OneLake 快捷转换 消除了这种开销:你只需指向你的文件一次,然后选择一个 AI 转换,Fabric 会执行其余的工作。
为什么使用人工智能驱动的转换技术?
| Benefit | 它为你意味着什么 |
|---|---|
| Accelerate time-to-insight | 在几分钟内从原始文本转到可查询的 Delta 表,无需 ETL。 |
| Lower maintenance | 转换引擎按 2 分钟计划监视源文件夹,因此输出会自动保持最新状态。 |
| Enterprise-grade security | PII 检测通过在数据进入分析之前去除敏感信息,有助于遵守 GDPR、HIPAA 和其他法规。 |
| 一致、可重复的结果 | 内置 AI 模型提供标准化情绪分数、实体标记和翻译,消除了手动数据准备偏差。 |
Microsoft Fabric 中的 OneLake 快捷方式转换包括一组内置 AI 支持的转换,这些转换可直接应用于.txt通过快捷方式引用的文件,而无需编写代码或生成管道。 引擎会自动使输出 Delta 表 保持同步,以便数据可供 Power BI、笔记本、管道和其他 Fabric 体验查询。
支持的 AI 转换
| Transform | Purpose |
|---|---|
| Summarization | 从长格式文本生成简明的摘要。 |
| Translation | 在支持的语言之间翻译文本。 |
| Sentiment analysis | 将文本情绪标记为 积极、 消极或 中性。 |
| PII detection | 查找和修订个人身份信息(姓名、电话号码、电子邮件)。 |
| Name recognition | 提取命名实体,例如人员、组织或地点。 |
Note
AI 转换目前仅支持.txt文件作为输入。
示例 - 客户反馈中的 PII 检测
存储在 Data Lake 中的客户反馈可能包含敏感数据(姓名、电子邮件、电话号码)。 应用 PII 检测 转换以自动扫描和修改此内容,并生成符合隐私的 Delta 表进行分析。
工作原理
-
创建快捷方式
在 Azure Data Lake、Amazon S3 或其他 OneLake 快捷方式源中引用.txt文件夹。 -
选择 AI 转换
在创建快捷方式期间选择一个受支持的转换。 -
Automatic sync
引擎每隔 2 分钟检查一次源文件夹。 Delta 表中记录了新的、被修改的或删除的文件。 -
Query-ready output
在报表、笔记本或下游管道中立即使用生成的表。
Regional availability
AI 驱动的变换目前在这些区域中可用: Azure AI 语言区域支持