Microsoft Fabric 变量库是一个包含多个变量的集合,供工作区中的其他项在应用程序生命周期管理(ALM)中使用。 它充当工作区中的一个项,该工作区包含变量列表,以及发布管道每个阶段的相应值。 它提供了一种统一的方法,用于在工作区中高效管理项配置,以帮助确保跨生命周期阶段的可伸缩性和一致性。
例如,变量库可以包含保存以下值的变量:
- 要在管道中的等待活动中使用的整数。
- 要作为 复制数据 活动中的源的 Lakehouse 引用。 每个值根据管道的发布阶段在不同的管道中使用。
- 将一个 Lakehouse 引用配置为笔记本的默认 Lakehouse。 每个值都根据笔记本文件的发布阶段用于不同的管道。
Fabric 变量库:
- 使用者项目中的值解析不一定与其部署直接相关。 相反,每个消费品都根据自己的上下文确定其价值。
- 变量库的体验因变量类型而异,但所有变量库都允许定义和管理其他项可以使用的变量。
优点
变量库使客户能够自定义和共享配置。
自定义配置
可以根据发布管道阶段配置变量值。 你可以使用多个值集来配置变量库:为发布管道的每个阶段设置一个值。 然后,在每个阶段的一次性活动值设置完成后,正确的值会自动在流水线阶段中使用。 示例包括:
- 根据阶段更改项的连接。
- 根据阶段切换到其他云数据源。
- 根据阶段调整查询中的数据数量。
共享配置
变量库为管理整个工作区的各项元素配置提供了一种集中的方式。 例如,如果工作区中有多个 lakehouse,并且每个 lakehouse 都有一个使用相同数据源的快捷方式,那么您可以创建一个变量库,将该数据源设为其中一个变量。 这样,如果要更改数据源,则必须仅在变量库中更改一次。 无须在每个湖库中分别更改它。
变量库结构
Fabric 中的变量库是一个结构化系统,旨在跨工作区和部署阶段管理配置参数。 其核心是用户定义的 变量,可以是基本类型(如字符串、整数、布尔值)或复杂类型(如 项引用)。 这些变量分组在变量库项内,可由同一工作区中的使用者项引用。
为了支持动态配置,每个变量可以有多个 值集 或针对不同环境定制的替代值集(例如开发、测试、生产)。 每个工作区将一个值集指定为“活动”,确定在运行时使用哪些值。
用户可以通过构造 UI 或 API 创建、编辑和管理变量和值集,并通过内置验证和权限检查。 该系统支持 CI/CD 工作流,允许变量作为代码进行管理,与 Git 集成,并通过管道进行部署。 此结构可确保跨复杂数据系统实现可缩放、自动化和受管理的配置管理。
支持的项目
以下项支持变量库:
- 管道
- Lakehouse 的快捷方式
- 笔记本,通过 NotebookUtils 和
%%configure - 数据流第 2 代
- 复制作业
- 用户数据函数
命名约定
变量库项本身的名称必须遵循以下约定:
- 不为空
- 没有前导空格或尾随空格
- 以字母开头
- 可以包括字母、数字、下划线、连字符和空格
- 长度不超过 256 个字符
变量库名称 不 区分大小写。
注意事项和限制
变量的限制
只要满足这两项要求,最多可以有 1,000 个变量 和 最多 1,000 个值集:
- 备用值集中的单元格总数小于 10,000。
- 项目的大小不超过 1 MB。
保存更改时会验证这些要求。
备注字段最多可包含 2,048 个字符。
值集描述字段最多可包含 2,048 个字符。
替代值集的限制
- 替代值集在变量库中以您添加它们的顺序出现。 目前,无法在 UI 中对它们重新排序。 若要更改顺序,请直接编辑 JSON 文件。
- 每个值集的名称在变量库中必须是唯一的。
- 变量名称在变量库中必须唯一。 如果变量位于不同的项中,则可以在工作区中具有同名的两个变量。
- 在变量库中,每次只能有一个且仅一个活动值集。 在活动时,无法删除设置的值。 若要删除它,请先配置设置为活动的另一个值。 可以为部署管道的每个阶段设置不同的活动值。