本页介绍有效使用 Databricks SQL 所需的核心概念。
接口和工具
| 接口 | 说明 |
|---|---|
| SQL 编辑器 | 用于编写和运行 SQL 查询的基于浏览器的接口。 包括集成的 AI 帮助、代码注释和版本历史记录。 |
| AI/BI | 商业智能解决方案,包括用于自助数据分析和聊天数据探索的仪表板和 Genie 空间。 |
| Notebooks | 将 SQL 与 Python、Scala 或 R 相结合的交互式文档。将笔记本附加到 SQL 仓库,以便与其他语言一起运行 SQL。 |
| 指标视图 | 一个语义层,用于定义可重用的业务指标,并在查询和仪表板中进行一致的计算。 |
| 警报 | 自动监视,该监视器根据条件评估查询结果,并在满足条件时传递通知。 |
| 作业 | 为自动化数据处理和报告工作流计划执行 SQL 查询。 |
| Etl | 定义和刷新 Databricks SQL 中用于增量 ETL 管道的流式处理表和具体化视图。 |
| REST API | 用于自动执行和管理 Databricks SQL 对象的编程接口。 |
查询和计算
| 概念 | 说明 |
|---|---|
| 查询 | 检索或转换数据的 SQL 语句。 Databricks SQL 中的查询保存、版本控制且可重用。 |
| SQL 仓库 | 执行 SQL 查询的计算资源。 所有 Databricks SQL 接口都在 SQL 仓库上运行查询。 |
| 查询历史记录 | 执行的查询记录,包括执行时间、资源使用情况和性能特征。 |
| 查询概况 | 查询的执行计划的详细视图。 使用它来确定瓶颈和优化机会。 |
| 可视化 | 查询结果的图形表示形式,例如条形图、折线图或表。 |
数据管理
| 概念 | 说明 |
|---|---|
| 仪表板 | 从一个或多个查询生成的可视化效果和注释的集合。 仪表板是可共享的,支持交互式筛选。 |
| 指标视图 | 由 SQL 表达式提供支持的业务指标的命名可重用定义。 跨团队和工具强制实施一致的计算。 |
| 流表 | 从流源中逐步摄取数据的表,由 Databricks SQL 管道管理。 |
| 具体化视图 | 预计算视图,其结果由 Databricks SQL 管道自动存储和刷新。 |
身份验证和授权
| 概念 | 说明 |
|---|---|
| 用户和组 | 用户是有权访问Azure Databricks工作区的唯一个人。 组是一组用于访问控制目的共同管理的用户集合。 |
| 个人访问令牌 | 用于向 REST API 进行身份验证并将第三方工具连接到 SQL 仓库的凭据。 |
| 访问控制列表 | 附加到对象的一组权限,用于控制哪些主体可以对其执行哪些操作。 |
| Unity Catalog | Azure Databricks的治理层。 跨工作区提供集中式访问控制、审核、世系和数据发现。 |