通过


更改模型版本和设置

本文将介绍如何更改提示生成器中的模型版本和设置。 模型版本和设置可能会影响生成式 AI 模型的性能和行为。

模型选择

可以通过选择提示生成器顶部的 “模型 ”来更改模型。 下拉菜单允许您从生成自定义提示答案的生成式 AI 模型中进行选择。

在Power Apps或Power Automate中使用提示会消耗 prompt builder 信用,而在 Copilot Studio 中使用提示将消耗 Copilot 信用。 请参阅 AI Builder 文档中的许可和提示生成器配额了解更多信息。

概述

下表介绍了可用的不同型号。

模型跨区域具有不同的可用性,并定期更新。 请参阅按区域划分的提示模型可用性及更新以了解更多信息。

备注

  • GPT-4o mini 和 GPT-4o 继续在美国政府管理的区域内使用。 这些模型遵循许可规则,并提供与 GPT-4.1 mini 和 GPT-4.1 分别相当的功能。
  • 人类模型托管在Microsoft外部,并受人类术语和数据处理的约束。 了解更多内容,请参见 “选择外部模型作为主要人工智能模型”。
GPT 模型 许可 功能 类别
GPT-4.1 mini(默认型号) 基础费率 根据截至 2024 年 6 月的数据进行训练。 最多输入128K代币。 小型
GPT-4.1 标准费率 根据截至 2024 年 6 月的数据进行训练。 上下文最多允许 128K 标记。 概述
GPT-5 聊天 标准费率 训练数据截至 2024 年 9 月。 上下文最多允许 128K 标记。 概述
GPT-5 推理 高级费率 训练数据截至 2024 年 9 月。 上下文最多允许 400K 标记。 深层
GPT-5.2 推理 高级费率 根据截至 2024 年 10 月的数据进行训练。 上下文最多允许 400K 标记。 深层
GPT-5.3 对话 标准费率 托管模型。 上下文最多允许 128K 标记。 概述
克洛德·索内 4.6 标准费率 来自 Anthropic 的外部模型。 上下文最多允许 200K 标记。 概述
克洛德作品4.6 高级费率 来自 Anthropic 的外部模型。 上下文最多允许 200K 标记。 深层
Grok 4.1 快速(非推理)(请参阅以下重要说明) 标准费率 xAI 的外部模型。 概述

重要

Microsoft 安全与负责任 AI 评估发现,Grok-4.1 Fast(非推理版)与其他评估模型的契合度较低,导致:(i) 模型生成潜在有害内容的风险更高,(ii) 在安全性和越狱基准测试中得分较低。 Grok-4.1 快速模式(非推理)可能会生成显式内容,并且这种倾向性可能比其他模型更高。 客户必须遵守 Microsoft Enterprise AI Services 行为准则xAI 的企业服务条款,包括其 Acceptable Use Policy。 此外,此模型可能会产生一些类别的危害,这些危害不受Microsoft的内容安全系统所涵盖。 因此,与所有实验模型一样,不建议使用 Grok-4.1 快速(非推理),客户应在选择 Grok-4.1 快速(非推理)之前查看 实验模型和预览模型的限制 ,并进行自己的评估。

许可

在代理、流程或应用中,任何使用模型的提示都将消耗Copilot积分,无论模型处于哪个发布阶段。 了解更多关于 计费率与管理的内容。

如果你有AI Builder 点数,系统会在 Power Apps 和 Power Automate 中使用提示时优先消耗它们。 在 Copilot Studio 中使用提示时,系统不会消耗 AI Builder 积分。 在 AI Builder 文档中详细了解 许可概述

发行阶段

模型会经历不同的发布阶段。 你可以尝试新的、前沿的实验和预览模型,或者选择可靠、经过充分测试且普遍可用的模型。

标记 描述
实验性 用于实验,而非生产用途。 受预览版期限约束,可用性与质量可能存在限制。
预览版 最终会成为通用模型,但目前不建议用于生产用途。 受预览版期限约束,可用性与质量可能存在限制。
无标签 正式发布。 此模型可用于大规模的生产用途。 通常通用模型无可用性与质量限制,但部分模型仍可能存在区域可用性等限制。
重要提示:Anthropic Claude 模型处于实验阶段,即使未显示标签。
默认 所有智能体的默认模型,通常是性能最佳的通用模型。 默认模型会随新型高性能通用模型的发布定期升级。 当选定模型关闭或不可用时,智能体还将使用默认模型作为备用。

实验模型和预览模型可能显示性能、响应质量、延迟或消息消耗等方面存在差异。 它们可能会超时或不可用。 此类模型受预览条款约束。

分类

下表说明不同模型类别特性:

类别 小型 概述 深层
性能 适用于大多数任务 胜任复杂任务 已被训练用于推理任务
速度 处理速度更快 可能由于复杂性导致速度变慢 速度较慢,因为它先推理再响应
用例 摘要、信息任务、图像和文档处理 图像与文档处理、高级内容创作任务 数据分析和推理任务,图像和文档处理

当你需要一个经济高效的解决方案来应对中等复杂度的任务、计算资源有限或需要更快的处理时,选择 微型 模型。 迷你模型非常适合预算有限的项目以及客户支持或高效代码分析等应用。

当你处理高度复杂、多模态且需要卓越性能和详细分析的任务时,选择 通用 模型。 对于准确性和高级功能至关重要的大型项目,它是更好的选择。 当你有预算和计算资源支持时,通用模型也是一个不错的选择。 对于随着时间推移复杂性可能会增加的长期项目,通用模型也是首选。

深度 模型非常适合需要高级推理能力的项目。 它们适合需要复杂问题解决和批判性思维的场景。 深度模型在细致入微的推理、复杂的决策和详细分析很重要的环境中表现出色。

根据地区可用性、功能、使用场景和成本选择模型。 请在按区域提供的模型和更新中了解您所在区域可用的模型及模型退役计划。 详细了解 AI Builder 功能速率表中的定价。

模型设置

你可以通过选择提示构建器顶部的三个点...进入>设置面板。 您可以更改以下设置:

  • 温度:较低温度产生可预测结果。 较高温度可获得更丰富或更具创意的响应。
  • 记录检索:为知识源检索的记录数。
  • 在回复中包含链接:选中后,回复中将包含检索记录的链接引文。
  • 启用代码解释器:选择后,生成 和执行代码的代码解释 器被启用。
  • 内容审核等级:最低级别产生最多答案,但可能包含有害内容。 最高级别的内容审核会采用更严格的过滤器来限制有害内容,并减少回答。

温度

通过滑块为生成式AI模型设置温度。 范围在0到1之间。 此值指导生成式 AI 模型应该提供多少创造性 (1) 与确定性答案 (0)。

备注

GPT-5 推理模型不支持温度设置。 因此选择 GPT-5 推理模型时滑块将不可用。

温度是控制AI模型输出随机性的参数。 较低的温度导致更可预测和更保守的输出。 相比之下,更高的温度允许更多创造性和多样性的回答。 这是一种微调模型输出中随机性和确定性平衡的方法。

与之前创建的提示一样,默认温度为 0。

温度 功能 使用位置
0 更可预测和更保守的输出。
回复更加一致。
要求准确性高且可变性较小的提示。
1 回复更具创造性和多样性。
更多样且有时更创新的回复。
创建新的现成内容的提示。

调节温度会影响模型的输出,但不能保证一定的结果。 人工智能的回复具有内在的概率性,即使在相同的温度设置下也会有所不同。

内容审核级别

通过滑块设置提示内容的审核等级。 降低审核强度后,你的提示能够提供更多答案。 然而,回答数量的增加可能会影响提示中允许的 有害内容 (仇恨与公平、性、暴力、自残)。

备注

内容审核级别设置仅适用于受管理模型。 因此,在选择 Anthropic 或 Azure AI Foundry 模型时,滑块将不可用。

调节度从 不等。 提示的默认审核等级为 “中等”。

较低的审核会增加提示回复中出现有害内容的风险。 更高的调节能降低风险,但可能会减少响应数量。

内容审核级别 描述 建议用途
Low 可能允许仇恨与公平、性、暴力或自残内容,内容包含明确且严重的有害指示、行为、损害或虐待。 包括支持、美化或推广严重有害行为、极端或非法的伤害、激进化,或非自愿的权力交换或滥用。 用于处理可能视为有害内容(例如,暴力描述或医疗程序)的数据的提示。
中等 可能允许针对特定身份群体使用冒犯性、侮辱性、嘲讽、恐吓或贬低语言的仇恨与公平、性、暴力或自残内容。 包括寻求并执行有害指令、幻想、美化、中等强度的伤害宣传的描述。 默认过滤。 适合大多数用途。
High 可能允许表达偏见、评判或观点的仇恨与公平、性、暴力或自残内容。 包括冒犯性语言使用、刻板印象、探索虚构世界的用例(例如游戏、文学)以及低强度的描绘。 如果你需要比中等级别更严格的过滤,可以使用。

要在使用提示时覆盖代理的内容审核设置,请在提示工具的完成界面设置“运行后”设置为发送特定响应(下文指定)。 要显示的消息应包含 Output.predictionOutput.text 自定义变量。

“完成”界面的截图,设置为“发送特定回复(请在下方说明)”。