通过


教程:加载数据

注释

此功能目前处于公开预览状态。 此预览版在没有服务级别协议的情况下提供,不建议用于生产工作负荷。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版的使用条款

在本教程步骤中,你将从 GitHub下载 Adventure Works 示例数据并将其加载到 lakehouse 中。 如果您已有一个数据湖屋(例如,来自您组织的数据),则可以跳过此步骤。

数据集包含 Parquet 格式的表。 这些表表示虚构的自行车制造公司(如客户、产品、订单和供应商)中的各种实体。 在后面的教程步骤中,你将使用此数据来生成和查询显示这些实体连接方式的图形。 例如,可以发现哪些客户购买了哪些产品,或者哪些供应商提供特定的产品类别。

下载示例数据

  1. 转到 GitHub 上 Microsoft Fabric GQL 示例数据集中的图表。

  2. 选择 adventureworks_docs_sample.zip 文件并将其下载到本地计算机。

    小窍门

    若要从GitHub下载文件,请选择该文件,然后选择 Download 原始文件图标。

  3. 将下载 的adventureworks_docs_sample.zip 文件解压缩到本地计算机上的文件夹。

    小窍门

    在文件资源管理器中,右键单击 zip 文件,然后选择“ 全部提取”。 然后选择目标文件夹,例如 c:\Downloads\AdventureWorks_Data

创建湖屋

如果您还没有创建 Lakehouse,请创建一个以存储示例数据:

  1. Microsoft Fabric 中,选择要创建 lakehouse 的工作区。

  2. 选择 + 新建项目

  3. 选择 Store data>Lakehouse

  4. 输入 lakehouse 的名称(例如,“AdventureWorksLakehouse”),清除 Lakehouse 架构 选项,然后选择“ 创建”。

    重要

    请确保清除 Lakehouse 架构选项。 Graph 当前不支持启用 lakehouse 架构的系统。

有关更详细的说明,请参阅 通过 OneLake 创建湖仓

将示例数据上传到 Lakehouse

  1. 在 lakehouse Explorer 中,将鼠标悬停在 文件上。 选择显示的三个省略号(...),然后选择“上传>上传文件夹”。

    注释

    无法通过上传文件来上传文件夹。

  2. 在“ 上传文件夹 ”对话框中,浏览到提取文件夹的位置并选择它。 然后,选择“上传”。 此时可能会显示一个弹出窗口,要求确认上传:再次选择“上传”,然后在“上传文件夹”对话框中选择“上传”。

    你的 Lakehouse 现在应包含已上传的AdventureWorks_Data文件夹以及数据文件。

    显示Microsoft Fabric 中上传的AdventureWorks_Data文件夹的屏幕截图。

将数据加载到表中

上传文件后,将它们加载到表中。 表是来自 lakehouse 的源数据,用于在图模型中创建节点和边缘。

对于上传 AdventureWorks_Data 文件夹中的每个子文件夹,请按照以下步骤将数据加载到表中:

  1. 将子文件夹(例如 ,adventureworks_customers)从 “文件 ”部分拖放到 Lakehouse Explorer 中的 “表 ”部分。

  2. “加载文件夹到新表 ”对话框中,输入表名称(默认值为文件夹名称),将文件类型设置为 Parquet,然后选择“ 加载”。

加载所有表后,Lakehouse Explorer 会显示八个表。 工作区中的湖屋现已准备好,有 Adventure Works 示例数据可用。 在下一步中,将创建使用此数据的图形模型。

显示 Lakehouse Explorer 中加载的表的屏幕截图。

后续步骤