你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文介绍如何从GitHub模型开始开发生成 AI 应用程序,然后使用 Microsoft Foundry 模型部署 Foundry Tools 资源来升级体验。
GitHub模型在开发生成 AI 应用程序时免费查找和试验 AI 模型时非常有用。 准备好将应用程序引入生产环境时,请在Azure订阅中部署 Foundry Tools 资源并开始使用 Foundry 模型来升级体验。 不需要更改代码中的其他任何内容。
GitHub 模型的操场和免费 API 使用受到每分钟请求数、每天请求数、每个请求的令牌数和并发请求数的速率限制。 如果受到速率限制,则需要等待命中的速率限制重置,然后才能发出更多请求。
先决条件
您需要:
- 一个具有 GitHub Models 访问权限的 GitHub 帐户。
- 具有有效付款方式的Azure订阅。 如果没有 Azure 订阅,请创建一个 付费 Azure 帐户 来开始。 或者,可以等待,直到准备好将模型部署到生产环境,此时系统会提示创建或将Azure帐户更新为标准帐户。
- 合作伙伴和社区的 Foundry 模型需要访问Azure Marketplace。 确保你拥有 订阅模型产品/服务所需的权限。 由 Azure 直接销售的 Foundry 模型没有此要求。
升级到 Foundry 模型
操场和免费 API 使用的速率限制会帮助你试验模型并开发 AI 应用程序。 当您准备好将应用程序引入生产环境中时,请使用Azure付费帐户中的密钥和端点。 不需要更改代码中的其他任何内容。
注释
GitHub 模型免费使用,但有速率限制。 升级到 Foundry 模型后,根据所选的 部署类型对Azure订阅计费。
若要获取密钥和终结点,请执行以下步骤:
转到 GitHub 模型,并选择一个模型以打开其交互界面。 本文使用 Mistral Medium 3 (25.05)。
输入一些提示或使用一些建议的提示与模型在实验环境中进行交互。
在操场中选择“使用此模型”。 此操作将打开一个窗口,以便“开始使用代码库中的模型”。
在“配置身份验证”步骤中,从“Azure AI”部分选择Get Microsoft Foundry 密钥。
一张屏幕截图显示如何从 GitHub 模型的 playground 中获取 Azure AI 生产密钥。 如果已登录到Azure帐户,请跳过此步骤。 但是,如果没有Azure帐户或未登录到帐户,请执行以下步骤:
如果没有Azure帐户,请选择创建帐户并按照步骤创建一个帐户。
或者,如果您有 Azure 帐户,请选择重新登录。 如果现有帐户是免费帐户,则首先必须升级到标准计划。
返回模型的操控界面,然后再次选择获取Microsoft Foundry密钥。
登录到Azure帐户。
你被带到了 Foundry > GitHub 并到达了 Foundry 项目的主页。
小窍门
如果登录 Foundry (经典) 体验,请切换右上角导航中的 New Foundry 切换器以切换到新的 Foundry 体验。
按照 “部署模型 ”中的步骤部署所选模型,在 Playground 中测试模型,并使用代码推断已部署的模型。
通过在 Playground 中发送测试提示来验证部署是否正常工作。 如果收到响应,则模型已准备好通过代码使用。
重要
与GitHub模型(已配置所有模型)不同,Foundry Tools资源允许你控制在终端和特定配置下可用的模型。 在 model 参数中指示模型之前,请添加你计划使用的任意数量的模型。 了解如何向资源添加更多模型。
探索其他功能
Foundry Models 支持GitHub模型中不可用的功能:
- Model 目录 - 浏览、比较和评估来自Azure、合作伙伴和开源社区的模型。
- 无密钥身份验证 - 无需管理 API 密钥即可对基于令牌的身份验证使用Microsoft Entra ID。
- 内容筛选 - 为部署配置内容安全筛选器。
- 速率限制 - 为资源中的特定模型设置自定义速率限制。
- 部署类型 - 从多个部署 SKU 中进行选择,例如按令牌付费、预配和批处理。
排查常见问题
| 問题 | 决议 |
|---|---|
| 模型在你所在的区域不可用 | 在其 model 目录页上检查模型的区域可用性并选择受支持的区域。 |
| 密钥交换后的身份验证错误 | 验证是否已从 Foundry 门户复制正确的密钥。 选择项目设置>密钥和终结点以查看您的密钥。 |
| 升级后的速率限制错误 | Foundry 模型速率限制取决于 部署类型。 纵向扩展或选择更高的吞吐量部署。 |