通过


使用 Genie Code 提供可观测性的模型

重要

此功能目前以公共预览版提供。

本文介绍了 Genie Code 如何帮助你诊断问题、分析性能并获取模型服务终结点的指导。

注释

Genie Code 目前仅支持提供终结点的自定义模型。

Genie Code 可以提供哪些帮助?

在模型服务终结点页上使用 Genie Code 时,它将成为模型服务的可观测性助手。 它可以分析终结点运行状况、诊断部署失败、调查延迟问题并提供最佳做法指南 -- 全部来自 Genie Code 窗格。

端点页面上的“Genie Code”窗格

Genie Code 是只读模式下的咨询器。 它可以检查终结点并提供建议,但不能修改配置或部署。 它提供明确的分步说明和文档链接,以便自己进行更改。

开始

开始之前:

  1. 转到提供终结点的模型页。
  2. 单击 “数据库助手”图标。 打开“Genie Code”窗格。
  3. 在右下角,选择 “代理”。 这将开启 Genie Code 的代理人模式。
  4. 输入详细提示描述您需要帮助的内容。 例如,“检查此终结点的运行状况”或“为什么我的延迟这么高?”

能力

健康检查和诊断

Genie Code 可以分析终结点的状态和配置,以确定潜在问题:

  • 检查终结点运行状况和部署状态。
  • 根据最佳做法查看配置。
  • 评估缩放和资源利用率。

故障排除和分析

Genie Code 可帮助解决终结点问题:

  • 使用生成日志、事件和终结点状态诊断部署失败。
  • 使用指标、事件和推理表数据调查高延迟或超时问题。
  • 分析服务日志和推理表中的错误模式。
  • 识别配置错误或资源约束。
  • 将当前配置和待处理配置进行比较,并进行风险评估。

指南和最佳做法

Genie Code 根据终结点的配置提供建议:

  • 建议为生产和开发工作负荷提供最佳缩放配置。
  • 说明终结点状态和转换。
  • 指导你进行监视和可观测性设置。
  • 搜索 Azure Databricks 文档并提供相关文章的链接。

用例

请尝试以下提示以开始使用:

  • 健康检查
    • “检查此终结点的运行状况。
    • “我的终结点配置正确吗?”
    • “查看终结点的缩放配置。”
  • 部署失败:
    • “/诊断”或“为什么我的部署失败?”
    • “帮助我修复部署错误。”
    • “我的端点停滞在挂起状态。”
  • 延迟调试:
    • “为什么我的延迟这么高?
    • “分析今天上午的延迟峰值。
    • “显示过去 24 小时内的性能指标。
  • 配置评审:
    • 我待处理的配置中发生了什么变化?
    • “我的并发设置是否适合生产?
    • “显示我的推理表配置。
  • 请求历史记录:
    • “向我显示对此终结点的最新请求。
    • “我的用户遇到什么错误?
    • “分析上周的错误模式。

其他信息