Azure Databricks Status Page概述了所有核心Azure Databricks服务。 还可以订阅单个服务组件的状态更新,并在订阅更改的服务状态时收到警报。
下图是屏幕截图,而不是实时链接。 若要查看实际当前状态,请单击此链接: “状态”页。
状态页按Azure区域细分。 选择四个主要地理之一(美洲、欧洲、亚太地区或 中东和非洲)以显示所选地理中的所有活动区域。
按区域跟踪服务状态。 服务可以在不同区域具有不同的状态。
除了Azure Databricks服务,状态页还显示整个Azure的状态。 Azure服务状态由Microsoft提供。 它是Azure Databricks外部的。
服务图标
服务状态由颜色编码的图标指示。
这些图标用于单个服务、整体地理区域以及外部服务。
所有服务都正常运行。
一个或多个服务处于降级状态。
一个或多个服务当前已关闭。
将对一个或多个服务进行计划内维护。
一个或多个服务因计划内维护而关闭。
将鼠标悬停在状态页上的图标上以显示当前状态的摘要。
事件页面
选择黄色、红色或蓝色的服务状态图标以显示详细的事件页。
事件页突出显示了 事件状态、受影响的 组件以及受影响的 位置。 解决事件后,事件页将在几分钟内显示事件的持续时间。
详细信息包含在事件页的“更新”部分中。 可在其中找到有关事件的最新信息,以及任何已知的缓解措施。
订阅
除了查看状态页之外,还可以选择通过以下方法之一(或多种)订阅更新:
注意
可以订阅每个区域中的各个服务。 这可确保仅收到与你相关的服务的警报。
订阅电子邮件通知:
- 单击“订阅更新”(位于状态页的右上角)。
- 单击“电子邮件”。
- 输入电子邮件地址。
- 单击“订阅”。
- 在“管理订阅”页上,选择要跟踪的所有组件。
- 单击 “保存订阅” 以确认选择。
若要管理现有订阅,请执行以下操作:
- 单击“订阅更新”(位于状态页的右上角)。
- 单击“电子邮件”。
- 单击 管理现有订阅。
- 输入具有活动订阅的电子邮件地址。
- 单击管理订阅,就会收到一封关于管理订阅的链接的电子邮件。
- 打开电子邮件并单击链接。
- 在 “管理订阅 ”页上,选择要跟踪的所有组件并取消选择要删除的所有组件。
- 单击 “保存订阅” 以确认选择。
Webhook
订阅 Webhook 通知:
- 单击“订阅更新”(位于状态页的右上角)。
- 单击“WEBHOOK”。
- 输入 Webhook 的 URL。
- 输入电子邮件地址。
- 单击“订阅”。
- 在“管理订阅”页上,选择要跟踪的所有组件。
- 单击 “保存订阅” 以确认选择。
若要管理现有订阅,请执行以下操作:
- 单击“订阅更新”(位于状态页的右上角)。
- 单击“WEBHOOK”。
- 单击 管理现有订阅。
- 输入你正在使用的 Webhook 的 URL。
- 输入具有活动订阅的电子邮件地址。
- 单击管理订阅,就会收到一封关于管理订阅的链接的电子邮件。
- 打开电子邮件并单击链接。
- 在 “管理订阅 ”页上,选择要跟踪的所有组件并取消选择要删除的所有组件。
- 单击 “保存订阅” 以确认选择。
Webhook 负荷示例
下面是一个可以通过 Webhook 发送的 JSON 载荷示例。
{
"id": "552adb8331a9553b11000008",
"message_id": "542adb8331a9553b11000008",
"title": "Server Upgrades",
"datetime": "2015-04-03T18:38:57.326Z",
"current_status": "Planned Maintenance",
"infrastructure_affected": [
{ "component": "551ed627b556f14210000005", "container": "551ed5ac590f5a3b10000006" },
{ "component": "551ed627b556f14210000005", "container": "551ed5b1c9f9404110000005" }
],
"components": [{ "name": "Chat Service", "_id": "551ed627b556f14210000005" }],
"containers": [
{ "name": "East Server", "_id": "551ed5ac590f5a3b10000006" },
{ "name": "West Server", "_id": "551ed5b1c9f9404110000005" }
],
"details": "We've completed upgrades for all East Servers. No issues so far. Moving on to West Servers next. Updates to follow.",
"maintenance_url": "https://status.io/pages/maintenance/5516e01e2e55e4e917000005/5116e01e2e33e4e413000001",
"status_page_url": "https://status.io/pages/5516e01e2e55e4e917000005"
}
Slack
订阅 Slack 通知:
- 单击“订阅更新”(位于状态页的右上角)。
- 单击“SLACK”。
- 单击“添加到 Slack”。
- 输入要接收通知的 Slack 工作区的名称。
- 单击 继续。
- 登录到 Slack 工作区。 如果 Slack 实例需要 2FA,则可能需要使用 2FA 进行验证。
- 选择现有通道以接收“状态页”消息。
- 单击“允许”。
- 在“管理订阅”页上,输入电子邮件地址,选择要跟踪的所有组件,然后取消选择要删除的所有组件。
- 单击 “保存订阅” 以确认选择。
若要管理现有订阅,请执行以下操作:
- 单击“订阅更新”(位于状态页的右上角)。
- 单击“SLACK”。
- 单击 管理现有订阅。
- 输入可接收状态更新的 Slack 通道 ID。
- 输入向 Slack 通道注册的电子邮件地址。
- 单击管理订阅,就会收到一封关于管理订阅的链接的电子邮件。
- 打开电子邮件并单击链接。
- 在“管理订阅”页面上,选择要跟踪的所有组件,然后取消勾选要删除的所有组件。
- 单击 “保存订阅” 以确认选择。
开放状态 API
除了在浏览器中查看服务运行状况之外,还可以使用公共 Status Page API 以编程方式检索Azure Databricks服务状态。
Azure Databricks状态页公开只读终结点,该终结点以 JSON 格式返回当前系统状态的计算机可读快照。 可以使用单个 HTTP GET 请求查询终结点,不需要身份验证。
终结点:https://status.azuredatabricks.net/1.0/status/5d49ec10226b9e13cb6a422e
示例请求:
curl https://status.azuredatabricks.net/1.0/status/5d49ec10226b9e13cb6a422e
响应为 JSON,包括以下内容:
- 总体系统状态
- 单个服务组件的状态
- 当前事件
- 计划性维护(如果有)
- 时间戳和描述性状态文本
示例响应
下面是显示 JSON 有效负载结构的截断示例。 实际响应包括所有服务和区域。
{
"result": {
"status_overall": {
"updated": "2026-03-31T00:19:18.679Z",
"status": "Operational",
"status_code": 100
},
"status": [
{
"id": "5d02c32d086f1d04b97eb367",
"name": "Compute",
"status": "Operational",
"status_code": 100,
"containers": [
{
"id": "5d02c768b2e5f00a022b5fb2",
"name": "US East 1",
"updated": "2026-03-31T00:19:18.253Z",
"status": "Operational",
"status_code": 100
}
],
"updated": "2026-03-31T00:19:18.350Z"
}
],
"incidents": [],
"maintenance": {
"active": [],
"upcoming": []
}
}
}
响应代码
响应包括两个用于不同用途的数字字段:
-
status:严重性或影响级别 - “它有多糟糕?” -
state:事件或维护事件的生命周期阶段 - “我们在响应中在哪里?”
这些值显示在事件和维护消息中。 以下各节介绍了每个字段的可能值。
事件生命周期(state 值)
该 state 字段指示事件或维护事件在其进展中的位置:
- 100 - 正在调查:此问题已被检测到,目前正在进行初步调查。
- 200 - 已确定:原因已知,缓解工作正在进行中。
- 300 - 监视:已应用修补程序,团队正在监视稳定性。
- 400 — 已解决:事件或维护活动已完成。
服务严重性(status 值)
该 status 字段表示发布消息时的影响级别:
- 100 — 操作:服务正常运行。
- 200 - 计划内维护:维护活动正在进行或计划。
- 300 — 性能下降:服务可用但受损。
- 400 — 部分服务中断:某些功能或组件不可用。
- 500 — 主要服务中断:广泛的服务中断。
维护事件
维护事件使用相同的具有不同语义的字段:
-
维护
status:通常200,指示正在进行中的或已安排的维护。 -
维护
state:-
100— 已宣布或计划 -
200— 正在进行的维护 -
300— 监视完成 -
400— 已完成
-