通过


状态页

Azure Databricks Status Page概述了所有核心Azure Databricks服务。 还可以订阅单个服务组件的状态更新,并在订阅更改的服务状态时收到警报。

下图是屏幕截图,而不是实时链接。 若要查看实际当前状态,请单击此链接: “状态”页

Azure状态页

状态页按Azure区域细分。 选择四个主要地理之一(美洲欧洲亚太地区中东和非洲)以显示所选地理中的所有活动区域。

按区域跟踪服务状态。 服务可以在不同区域具有不同的状态。

除了Azure Databricks服务,状态页还显示整个Azure的状态。 Azure服务状态由Microsoft提供。 它是Azure Databricks外部的。

服务图标

服务状态由颜色编码的图标指示。

这些图标用于单个服务、整体地理区域以及外部服务。

服务操作 所有服务都正常运行。

服务降级 一个或多个服务处于降级状态。

服务关闭 一个或多个服务当前已关闭。

计划内维护 将对一个或多个服务进行计划内维护。

活动维护 一个或多个服务因计划内维护而关闭。

将鼠标悬停在状态页上的图标上以显示当前状态的摘要。

事件页面

选择黄色、红色或蓝色的服务状态图标以显示详细的事件页。

事件页突出显示了 事件状态、受影响的 组件以及受影响的 位置。 解决事件后,事件页将在几分钟内显示事件的持续时间

详细信息包含在事件页的“更新”部分中。 可在其中找到有关事件的最新信息,以及任何已知的缓解措施。

订阅

除了查看状态页之外,还可以选择通过以下方法之一(或多种)订阅更新:

注意

可以订阅每个区域中的各个服务。 这可确保仅收到与你相关的服务的警报。

Email

订阅电子邮件通知:

  1. 单击“订阅更新”(位于状态页的右上角)
  2. 单击“电子邮件”
  3. 输入电子邮件地址。
  4. 单击“订阅”
  5. 在“管理订阅”页上,选择要跟踪的所有组件。
  6. 单击 “保存订阅” 以确认选择。

若要管理现有订阅,请执行以下操作:

  1. 单击“订阅更新”(位于状态页的右上角)
  2. 单击“电子邮件”
  3. 单击 管理现有订阅
  4. 输入具有活动订阅的电子邮件地址。
  5. 单击管理订阅,就会收到一封关于管理订阅的链接的电子邮件。
  6. 打开电子邮件并单击链接。
  7. “管理订阅 ”页上,选择要跟踪的所有组件并取消选择要删除的所有组件。
  8. 单击 “保存订阅” 以确认选择。

Webhook

订阅 Webhook 通知:

  1. 单击“订阅更新”(位于状态页的右上角)
  2. 单击“WEBHOOK”
  3. 输入 Webhook 的 URL。
  4. 输入电子邮件地址。
  5. 单击“订阅”
  6. 在“管理订阅”页上,选择要跟踪的所有组件。
  7. 单击 “保存订阅” 以确认选择。

若要管理现有订阅,请执行以下操作:

  1. 单击“订阅更新”(位于状态页的右上角)
  2. 单击“WEBHOOK”
  3. 单击 管理现有订阅
  4. 输入你正在使用的 Webhook 的 URL。
  5. 输入具有活动订阅的电子邮件地址。
  6. 单击管理订阅,就会收到一封关于管理订阅的链接的电子邮件。
  7. 打开电子邮件并单击链接。
  8. “管理订阅 ”页上,选择要跟踪的所有组件并取消选择要删除的所有组件。
  9. 单击 “保存订阅” 以确认选择。

Webhook 负荷示例

下面是一个可以通过 Webhook 发送的 JSON 载荷示例。

{
  "id": "552adb8331a9553b11000008",
  "message_id": "542adb8331a9553b11000008",
  "title": "Server Upgrades",
  "datetime": "2015-04-03T18:38:57.326Z",
  "current_status": "Planned Maintenance",
  "infrastructure_affected": [
    { "component": "551ed627b556f14210000005", "container": "551ed5ac590f5a3b10000006" },
    { "component": "551ed627b556f14210000005", "container": "551ed5b1c9f9404110000005" }
  ],
  "components": [{ "name": "Chat Service", "_id": "551ed627b556f14210000005" }],
  "containers": [
    { "name": "East Server", "_id": "551ed5ac590f5a3b10000006" },
    { "name": "West Server", "_id": "551ed5b1c9f9404110000005" }
  ],
  "details": "We've completed upgrades for all East Servers. No issues so far. Moving on to West Servers next. Updates to follow.",
  "maintenance_url": "https://status.io/pages/maintenance/5516e01e2e55e4e917000005/5116e01e2e33e4e413000001",
  "status_page_url": "https://status.io/pages/5516e01e2e55e4e917000005"
}

Slack

订阅 Slack 通知:

  1. 单击“订阅更新”(位于状态页的右上角)
  2. 单击“SLACK”
  3. 单击“添加到 Slack”
  4. 输入要接收通知的 Slack 工作区的名称。
  5. 单击 继续
  6. 登录到 Slack 工作区。 如果 Slack 实例需要 2FA,则可能需要使用 2FA 进行验证。
  7. 选择现有通道以接收“状态页”消息。
  8. 单击“允许”
  9. 在“管理订阅”页上,输入电子邮件地址,选择要跟踪的所有组件,然后取消选择要删除的所有组件
  10. 单击 “保存订阅” 以确认选择。

若要管理现有订阅,请执行以下操作:

  1. 单击“订阅更新”(位于状态页的右上角)
  2. 单击“SLACK”
  3. 单击 管理现有订阅
  4. 输入可接收状态更新的 Slack 通道 ID。
  5. 输入向 Slack 通道注册的电子邮件地址。
  6. 单击管理订阅,就会收到一封关于管理订阅的链接的电子邮件。
  7. 打开电子邮件并单击链接。
  8. 在“管理订阅”页面上,选择要跟踪的所有组件,然后取消勾选要删除的所有组件。
  9. 单击 “保存订阅” 以确认选择。

开放状态 API

除了在浏览器中查看服务运行状况之外,还可以使用公共 Status Page API 以编程方式检索Azure Databricks服务状态。

Azure Databricks状态页公开只读终结点,该终结点以 JSON 格式返回当前系统状态的计算机可读快照。 可以使用单个 HTTP GET 请求查询终结点,不需要身份验证。

终结点:https://status.azuredatabricks.net/1.0/status/5d49ec10226b9e13cb6a422e

示例请求

curl https://status.azuredatabricks.net/1.0/status/5d49ec10226b9e13cb6a422e

响应为 JSON,包括以下内容:

  • 总体系统状态
  • 单个服务组件的状态
  • 当前事件
  • 计划性维护(如果有)
  • 时间戳和描述性状态文本
示例响应

下面是显示 JSON 有效负载结构的截断示例。 实际响应包括所有服务和区域。

{
  "result": {
    "status_overall": {
      "updated": "2026-03-31T00:19:18.679Z",
      "status": "Operational",
      "status_code": 100
    },
    "status": [
      {
        "id": "5d02c32d086f1d04b97eb367",
        "name": "Compute",
        "status": "Operational",
        "status_code": 100,
        "containers": [
          {
            "id": "5d02c768b2e5f00a022b5fb2",
            "name": "US East 1",
            "updated": "2026-03-31T00:19:18.253Z",
            "status": "Operational",
            "status_code": 100
          }
        ],
        "updated": "2026-03-31T00:19:18.350Z"
      }
    ],
    "incidents": [],
    "maintenance": {
      "active": [],
      "upcoming": []
    }
  }
}

响应代码

响应包括两个用于不同用途的数字字段:

  • status:严重性或影响级别 - “它有多糟糕?”
  • state:事件或维护事件的生命周期阶段 - “我们在响应中在哪里?”

这些值显示在事件和维护消息中。 以下各节介绍了每个字段的可能值。

事件生命周期(state 值)

state 字段指示事件或维护事件在其进展中的位置:

  • 100 - 正在调查:此问题已被检测到,目前正在进行初步调查。
  • 200 - 已确定:原因已知,缓解工作正在进行中。
  • 300 - 监视:已应用修补程序,团队正在监视稳定性。
  • 400 — 已解决:事件或维护活动已完成。
服务严重性(status 值)

status 字段表示发布消息时的影响级别:

  • 100 — 操作:服务正常运行。
  • 200 - 计划内维护:维护活动正在进行或计划。
  • 300 — 性能下降:服务可用但受损。
  • 400 — 部分服务中断:某些功能或组件不可用。
  • 500 — 主要服务中断:广泛的服务中断。
维护事件

维护事件使用相同的具有不同语义的字段:

  • 维护 status:通常 200,指示正在进行中的或已安排的维护。
  • 维护 state
    • 100 — 已宣布或计划
    • 200 — 正在进行的维护
    • 300 — 监视完成
    • 400 — 已完成