通过


你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

映射数据流视频教程

适用于: Azure 数据工厂 Azure Synapse Analytics

提示

Microsoft Fabric 中的 Data Factory 是下一代 Azure 数据工厂,具有更加简化的架构、内置人工智能和新功能。 如果不熟悉数据集成,请从Fabric数据工厂开始。 现有 ADF 工作负载可以升级到 Fabric,以跨数据科学、实时分析和报告访问新功能。

下面是由Azure 数据工厂团队创建的映射数据流教程视频的列表。

随着产品的不断更新,某些功能在当前Azure 数据工厂用户体验中已添加或不同功能。

入门

开始使用 Azure 数据工厂中的映射数据流

调试和开发映射数据流

调试和测试映射数据流

数据浏览

数据预览快速操作

监视和管理映射数据流性能

基准计时

数据流的调试工作流程

更新的监视视图

转型简介

聚合转换

更改行转换

派生列转换

联接转换

自联接模式

查找转换

查找转换更新和提示

透视转换

透视转换:映射漂移列

选择转换

选择转换:基于规则的映射

选择转换:大型数据集

代理键转换

联合转换

取消透视转换

窗口转换

筛选转换

有条件拆分转换

存在转换

动态联接和动态查找

扁平化变换

Flowlets

字符串转换

外部调用转换

转换层次结构数据

排名转换

缓存查找

通过窗口转换实现行上下文

解析转换

转换复杂数据类型

输出到下一个活动

字符串化转换

外部调用转换

断言转换

记录断言错误行

模糊联接

源和汇

读取和写入 JSON

Parquet 和定界文本文件

CosmosDB 连接器

推断分隔文本文件中的数据类型

读取和写入分区文件

转换和创建多个 SQL 表

在数据湖中对文件进行分区

数据仓库加载模式

Data lake file output options(Data Lake 文件输出选项)

优化映射数据流

数据世系

使用参数迭代文件

缩短启动时间

SQL DB 性能

日志记录和审核

在运行时动态优化数据流群集大小

优化数据流启动时间

Azure Integration Runtime 的数据流

通过 Azure IR 进行快速的群集启动

映射数据流情景

模糊查找

暂存数据模式

清理地址模板

重复数据删除

合并文件

缓慢变化维度类型 1:覆盖

缓慢变化的维度类型 2:历史记录

事实数据表加载

通过增量数据加载模式优化本地SQL Server

参数化

不重复行 与行计数

处理截断错误

智能数据路由

敏感数据的数据掩码

逻辑模型与物理模型

检测源数据更改

泛型类型 2 渐变维度

在源中不存在时删除目标中的行

使用 Azure 数据工厂 和 Azure SQL DB 进行增量数据加载

使用 Parse 和 Flatten 从事件中心转换 Avro 数据

数据流表达式

日期/时间表达式

拆分数组和 case 语句

字符串插值与参数的使用技巧

数据流脚本简介:复制、粘贴、代码段

数据质量表达式

集合聚合函数

作为参数的动态表达式

用户定义的函数

Metadata

元数据验证规则