Lakehouse 浏览页面充当 Lakehouse 环境中所有交互的中心。 资源管理器集成在 Fabric 门户中。 若要打开湖仓资源管理器,请转到包含湖仓的工作区。 查找并选择你的湖仓项,这会打开资源管理器,在其中可以与湖仓数据交互。 资源管理器是您将数据无缝加载到 Lakehouse 的入口,让您可以浏览数据、预览内容,并执行各种与数据相关的任务。 此页面分为三个主要部分:Lakehouse Explorer、主视图和工具栏。
Lakehouse 浏览器
Lakehouse 浏览器提供了整个 Lakehouse 的统一图形界面,为用户提供了用于数据导航、访问和管理的直观界面。
表格部分是湖仓内托管区域的用户友好表示形式。 通常组织和管理此区域,以促进高效的数据处理和分析。 在这里,你将找到所有表,无论它们是自动生成的,还是显式创建并在元存储中注册的。
在此处,您可以:
- 浏览您的 Lakehouse 架构定义、表和表格详细信息。
- 选择要预览的表。
- 从表上下文菜单中访问基础表文件。
- 对表对象执行常见作,例如重命名、删除、创建新架构或快捷方式并查看表属性。
身份不明区域是湖屋托管区域内的唯一空间。 它显示托管区域中任何没有在我们的元存储中关联表的文件夹或文件。
例如:如果用户将不受支持的文件(如图像或音频文件)上传到管理区域,则不会自动检测或映射到我们的元存储中的表中。相反,它们会出现在这个未识别的区域。
使用此部分可以:
- 标识不属于托管区域的文件。
- 将这些文件传输到“文件”部分以供进一步处理。
- 从 Lakehouse 中删除这些文件。
文件区段表示湖仓的未管理区域,可以被视为从各种来源导入的原始数据的“登陆区域”。 在这些数据可用于分析之前,通常需要进行额外的处理。
在此处,您可以:
- 浏览 Lakehouse 目录。
- “文件”部分以独占方式在 OE 中显示文件夹级对象。 若要查看文件,请使用主视图区域。
- 选择要在“主视图”区域中预览和浏览的文件夹,以了解有关文件的详细信息。
- 对文件夹对象执行常见作,例如重命名、删除、创建新子文件夹或快捷方式以及上传文件和文件夹。
- 浏览 Lakehouse 目录。
通过对象资源管理器,可以添加 多个 lakehouse 作为 引用,这样就可以在单个统一视图中查看和管理它们,从而更轻松地组织和访问数据。
使用此功能,可以:
- 添加你有权访问的参考湖仓,同时确保主要湖仓清晰可分。
- 对所有已添加的 Lakehouses 中的所有架构、表和文件夹进行排序、筛选和搜索。
- 直接在资源管理器中执行关键作,例如预览数据、创建子文件夹、重命名对象等。
- 复制引用的湖屋 URL,以将引用的湖屋作为主湖屋打开。
注释
功能区操作仅适用于主湖仓。
主视图区域
Lakehouse 页面的主视图区域是大部分数据交互发生的空间。 视图会根据所选内容而更改。 由于对象资源管理器仅显示数据湖中的文件夹层级结构,因此主视图区域用于导航文件、预览文件和表,以及执行各种其他任务。
表预览
我们的数据表预览网格配备了一套强大的功能,增强您的数据交互体验,令数据处理更加流畅。 下面是一些关键功能:
只需单击一下即可按升序或降序对列进行排序。 此功能可让你在处理大型语义模型时或需要快速识别趋势时完全控制数据的组织。
通过子字符串或从表中的可用值列表中选择来筛选数据。
调整列大小以定制数据视图以适应你的偏好。 此功能可帮助你确定基本数据的优先级或扩展视野,以包含更广泛的信息范围。
文件预览
在 Lakehouse 中预览数据文件提供了一系列优势,可增强数据质量、理解和整体数据管理效率。 它使数据专业人员能够做出明智的决策、优化资源分配,并确保其分析基于可靠且有价值的数据。
预览版适用于以下文件类型:
图像文件类型: jpg、jpeg、png、bmp、gif、svg
文本文件类型: txt、js、ts、tsx、py、json、xml、css、mjs、md、html、ps1、yaml、yml、log、sql
筛选、排序和搜索 Lakehouse 对象
通过排序、筛选和搜索功能,可以在对象资源管理器(OE)和主视图区域中更轻松地访问和组织数据。 这些工具简化了 Lakehouse 数据的导航和管理,尤其是在处理大量架构、表、文件或文件夹时。
支持的功能包括:
- 按名称或创建日期对架构、表、文件和文件夹进行排序,以便按首选顺序查看数据。
- 可通过对象的上下文菜单使用。
- 排序仅适用于所选父节点的直属子节点。
- 根据类型、加载状态或创建日期筛选对象,以便快速查找特定类型的数据。
- 在对象资源管理器中:筛选架构和表。
- 在主视图区域中:筛选文件和文件夹。
- 按名称搜索架构、表、文件或文件夹,通过输入子字符串快速查找特定项。
- 在对象资源管理器中:搜索架构和表。
- 在主视图区域中:搜索文件和文件夹。
在 Lakehouse 资源管理器中下载文件
Lakehouse 允许你直接从 UX 下载文件,使你能够更高效地工作,减少数据工作流中的摩擦,并更快地获得见解。
可以使用此功能实现以下操作:
- 从表格文件和“文件”部分下载文件(需要相应权限)。
- 在支持的文件中添加 Microsoft 信息保护(MIP)敏感度标签,确保数据安全和合规。
若要启用相应的功能,请执行以下作:
- 选择 “管理门户>租户”设置。
- 在 OneLake 设置 下,打开“用户可以使用 Fabric 外部的应用访问 OneLake 中存储的数据”。
表深层链接
用户可以为 Lakehouse 中的任何表生成唯一 URL,从而允许他们直接预览该特定表。 通过复制此 URL 并将其与有权访问的其他人共享,收件人可以使用已预览的所选表打开 Lakehouse Explorer。 只需单击“...” 在表旁边选择“复制 URL”。 可以用此链接在 Lakehouse Explorer 中打开 Lakehouse,并查看所选表的预览。
功能区
Lakehouse 功能区是您的快速访问操作栏,提供在 Lakehouse 内执行基本任务的便捷方法。 在这里,可以刷新 Lakehouse、访问项目设置、选择加载数据的选项、创建或打开笔记本、创建新的自定义语义模型等。
访问 Lakehouse 的 SQL 分析终结点
可以使用功能区右上角区域的下拉列表直接从 lakehouse 访问 SQL 分析终结点。 使用此快速访问方法,可以立即进入 t-sql 模式,这样就可以直接在数据湖中的 Delta 表之上工作,以帮助你为报告准备数据。
相关内容
我们希望本指南帮助你充分利用 Lakehouse 探险家及其多样化的功能。 尽量探索、尝试并提升数据管理任务的效率。