你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
数据目标: 每个组织都希望其数据能够推动自信的业务决策。 数据必须受信任、易于重复使用以用于分析和 AI,并且默认情况下是安全的。 数据挑战: 对于大多数组织来说,这一目标很难实现。 数据分布在系统和团队之间。 标准有所不同。 治理不一致。 这些问题使得分析及其 AI 难以自信地使用。
Data solution:许多组织通过将数据平台与Microsoft Fabric统一来解决这一挑战。 Fabric使团队能够创建可在整个组织中管理和安全地用于分析和 AI 的受信任数据产品(请参阅图 1)。 本指南为决策者提供了他们需要进行这种转变并建立统一数据基础的框架。
为何使用 Fabric 统一数据平台?
大多数业务和技术领导者都了解碎片化数据的成本。 常常阻碍他们的是,他们相信修复它需要大规模且有风险的迁移。 Microsoft Fabric采用不同的方法,在不中断的情况下提供价值。 主要优势包括:
最小化业务中断:Fabric通过使用虚拟化(快捷方式)和选择性复制(镜像)连接到现有系统。 团队可以统一访问数据,而不会中断当前操作。
内置治理: Fabric将数据工程、分析和 BI 引入单个平台。 安全和治理策略定义一次,并一致地应用,而不是在多个工具之间以不同的方式重新创建和强制实施。
人工智能和分析的基础: Fabric 使组织能够生成可重用、高质量的数据产品。 这些值得信赖的产品加快了分析和人工智能方面的举措。 Fabric IQ有助于统一和提供数据的上下文。 Foundry IQ允许Microsoft Foundry 代理对受管理、受信任的数据进行推理。
需要哪种级别的投资?
统一数据平台是一项对功能的投资,而不是每个系统的批发更换。 目标是继续使用现有数据系统并构建一个可随时间推移增长的共享基础。 关键成本因素包括:
Microsoft Fabric成本因素:主要成本因素包括(见图 2):
Microsoft Purview成本因素:使用Microsoft Purview实现统一数据管理和合规性。 Purview 在整个数据资产环境中提供集中式数据目录、数据分类和策略执行。 数据可以位于 OneLake、Azure、本地、第三方 SaaS 或其他云平台中。 主要 Purview 成本因素 包括 基于订阅的授权 和 基于使用的功能。 持续许可以及使用 Purview 治理的数据和服务量的预算。
Azure成本因素:使用Azure订阅来托管Fabric计算(容量)和Microsoft Purview帐户。 Azure订阅无需额外付费。 如果将其他Azure服务(如Azure Databricks或Azure 机器学习)集成到统一平台中,请记住这些服务有自己的定价模型。 规划这些成本。 请参阅 Azure Databricks 的成本因素和 Azure 机器学习 的成本因素。
多久后会看到价值?
Microsoft Fabric旨在快速交付价值。 实现价值的时间较短,因为统一不依赖于全面迁移。 团队可以从少量高价值数据产品开始。 每个步骤在限制风险时都会增加值。 实际上,许多组织在几周内看到初始分析或 AI 方案的价值。 随着Fabric成为数据产品、分析和 AI 的标准基础,通过在整个组织中重复使用和一致标准来增加价值。
如何统一数据平台?
Microsoft的云采用框架概述了统一数据平台的四步框架。 该过程涉及规划和组织数据策略。 它涵盖体系结构决策。 它还有助于设置治理和安全基线并定义作标准。
组织就绪情况。 定义数据策略并建立数据所有权和域。 阐明数据如何创造业务价值,以及谁负责哪些数据。 请参阅 组织就绪情况。
建筑: 提供统一数据平台所需的技术。 在Azure中设置Microsoft Fabric和必需的环境。 请参阅 体系结构。
治理和安全基线:使用 Microsoft Purview 实现跨数据资产的集中治理和可见性。 从一开始就将安全性和符合性基线构建到Fabric体系结构中。 请参阅 治理和安全基线。
操作标准。 定义用于引入原始数据、创建数据产品和管理其生命周期的一致过程。 确定在整个组织中发布、保护和使用数据产品的方式。 请参阅 操作标准。
通过执行这些步骤,可以采用结构化方式统一数据平台。 如果不知道从何处开始,请使用以下决策树获取指导。
用于统一数据平台的决策树
图 3. Microsoft用于统一数据平台的决策树。
后续步骤
在以下部分中,你将在每个步骤中找到指导、清单、最佳做法、决策指南和权衡。 本指南适用于监督组织策略和管理的领导和决策者。
关键术语
| 关键术语 | 定义 |
|---|---|
| Analytics | 从数据生成见解以支持决策的做法。 它包括仪表板、报表和可视化,例如,Power BI。 |
| AI | 使用数据作为输入来自动化业务功能的模型的系统。 此类别包括传统的机器学习模型(预测)和生成 AI 模型。 |
| 数据产品 | 以对您的业务有价值的形式呈现的数据,例如数据集、表格、特征集或 AI 训练数据。 |
| 数据域 | 数据产品的责任和所有权边界,如业务部门(HR、市场营销、财务、销售、运营)和生产线(产品 1、产品 2)。 |
| 数据管理着陆区 | 用于数据管理资源(例如 Microsoft Purview 帐户和 Fabric 容量)的环境,包括一个或多个 Azure 订阅。 |
| 数据着陆区 | 一个环境(由一个或多个Azure订阅组成),用于数据和 AI/ML 资源,例如Azure Databricks、Azure Data Lake Storage和Azure 机器学习。 |