モデルのバージョンと設定を変更する

この記事では、プロンプト ビルダーでモデルのバージョンと設定を変更する方法について説明します。 モデルのバージョンと設定は、生成 AI モデルのパフォーマンスと動作に影響を与える可能性があります。

モデルの選択

プロンプト ビルダーの上部にある [モデル] を選択すると、 モデル を変更できます。 ドロップダウン メニューでは、カスタム プロンプトに対する回答を生成する生成 AI モデルを選択できます。

Power AppsまたはPower Automateでプロンプトを使用すると、prompt ビルダー クレジットが使用されますが、Copilot Studioでプロンプトを使用すると、Copilot クレジットが消費されます。 詳細については、AI BuilderドキュメントのLicensing およびプロンプト ビルダー クレジットを参照してください。

概要

以下の表は利用可能なさまざまなモデルを説明しています。

モデルはリージョン間で異なる可用性を持ち、定期的に更新されます。 詳細については、 リージョンと更新プログラムによるモデルの可用性の確認に関するページを参照してください。

注意

  • GPT-4o mini と GPT-4o は、引き続き米国政府リージョンで使用されています。 これらのモデルはライセンス規則に従って、それぞれ GPT-4.1 mini と GPT-4.1 に匹敵する機能を提供します。
  • アントロピック モデルはMicrosoftの外部でホストされ、Anthropic の用語とデータ処理の対象となります。 詳細については、「 プライマリ AI モデルとして外部モデルを選択する」を参照してください。
GPT モデル ライセンス 機能 カテゴリ
GPT-4.1 mini(デフォルトモデル) 基本料金 2024 年 6 月までのデータでトレーニング済み。 最大128Kトークンを入力できます。 ミニ
GPT-4.1 標準料金 2024 年 6 月までのデータでトレーニング済み。 最大128Kトークンまでのコンテキストが許可されています。 一般
GPT-5 チャット 標準料金 2024 年 9 月までのデータでトレーニング済み。 最大128Kトークンまでのコンテキストが許可されています。 一般
GPT-5 推論 プレミアム料金 2024 年 9 月までのデータでトレーニング済み。 最大 400K トークンまでのコンテキストが許可されます。 ディープ
GPT-5.2の推論 プレミアム料金 2024 年 10 月までのデータでトレーニング済み。 最大 400K トークンまでのコンテキストが許可されます。 ディープ
GPT-5.3 チャット 標準料金 マネージド モデル。 最大128Kトークンまでのコンテキストが許可されています。 一般
クロード・ソネット 4.6 標準料金 Anthropic の外部モデル。 最大 200K トークンまでのコンテキストが許可されます。 一般
クロード作品4.6 プレミアム料金 Anthropic の外部モデル。 最大 200K トークンまでのコンテキストが許可されます。 ディープ
Grok 4.1 Fast (非推論) (次の重要な注意事項を参照) 標準料金 xAI からの外部モデル。 一般

Important

Microsoftの安全性と責任ある AI の評価では、Grok-4.1 Fast (Non-Reasoning) が評価された他のモデルよりもアライメントが低く、(i) モデルが潜在的に有害なコンテンツを生成するリスクが高くなり、(ii) 安全性と脱獄のベンチマークに関するスコアが低くなることが判明しました。 Grok-4.1 Fast (非推論) は、明示的なコンテンツを生成できる場合があり、他のモデルよりも高い傾向を持つ場合があります。 お客様は、Microsoft Enterprise AI サービスの行動規範xAI のエンタープライズサービス利用規約 (Acceptable Use Policy を含む) の両方に準拠する必要があります。 さらに、このモデルが生成する可能性のある損害のカテゴリが、Microsoftのコンテンツの安全システムでカバーされていない可能性があります。 したがって、すべての試験モデルと同様に、Grok-4.1 Fast (非推論) は運用環境での使用には推奨されません。お客様は、Grok-4.1 Fast (非推論) を選択する前に 、試験的モデルとプレビュー モデルの制限事項 を確認し、独自の評価を実施する必要があります。

ライセンス

エージェント、フロー、またはアプリでは、モデルを使用するプロンプトは、モデルのリリース 段階に関係なく、Copilot クレジットを消費します。 請求料金と管理について詳しくはこちらをご覧ください。

AI Builder クレジットがある場合、プロンプトが Power Apps および Power Automate で使用されるときに、システムが最優先で使用します。 プロンプトがCopilot Studioで使用されている場合、システムはAI Builderクレジットを消費しません。 詳細については、AI Builderドキュメントのライセンスの概要を参照してください。

リリース段階

モデルはリリースの異なる段階を経ます。 新しく最先端の実験モデルやプレビューモデルを試すこともできますし、信頼性が高く、十分にテストされた一般利用可能なモデルを選ぶこともできます。

タグ 説明
実験段階 実験用であって、生産用ではありません。 プレビュー条件に従い、可用性と品質に制限がある場合があります。
プレビュー 最終的には一般提供モデルになりますが、現時点では運用環境での使用はお勧めしません。 プレビュー条件に従い、可用性と品質に制限がある場合があります。
タグなし 一般提供されています。 このモデルは、拡張可能性のある運用環境で使用できます。 ほとんどの場合、一般提供モデルでは可用性と品質に制限はありませんが、リージョンの可用性など、いくつかの制限が引き続き存在する場合があります。
重要: Anthropic Claude モデルは、タグが表示されていない場合でも実験段階にあります。
デフォルト すべてのエージェントの既定のモデルであり、通常は最もパフォーマンスの高い一般提供モデルです。 既定のモデルは、新しいより多くの機能を備えるモデルが一般公開されると定期的にアップグレードされます。 エージェントは、選択したモデルが無効になっていたり使用できない場合でも、既定のモデルをフォールバックとして使用します。

実験モデルやプレビューモデルでは、パフォーマンス、応答品質、遅延、メッセージ消費にばらつきが見られることがあります。 タイムアウトや対応不可になることもあります。 これらは、プレビュー条件の対象となります

分類

次の表に、モデルのさまざまなカテゴリを示します。

カテゴリ ミニ 一般 ディープ
パフォーマンス ほとんどのタスクに適しています 複雑なタスクに優れている 推論タスク用にトレーニングされている
速度 より高速な処理 複雑さのために遅くなる可能性があります 応答する前に考えるため、遅くなる
利用事例 要約処理、情報タスク、画像、ドキュメント処理 画像およびドキュメント処理、高度なコンテンツ作成タスク データ分析と推論タスク、画像およびドキュメント処理

中程度の複雑なタスクに対してコスト効率の良いソリューションが必要な場合、計算資源が限られている場合、またはより高速な処理が必要な場合に ミニモデルを 選びましょう。 ミニモデルは予算の制約があるプロジェクトや、カスタマーサポートや効率的なコード解析などの用途に最適です。

高度なパフォーマンスと詳細な分析を必要とする非常に複雑で多様調なタスクを扱う場合は 、一般的な モデルを選びましょう。 精度と高度な機能が重要となる大規模プロジェクトには、これがより適した選択肢です。 予算と計算資源が確保できる場合、一般的なモデルも良い選択肢です。 汎用モデルは、時間の経過とともに複雑さが増す可能性のある長期的なプロジェクトにも適しています。

ディープモデルは 高度な推論能力を必要とするプロジェクトに優れています。 高度な問題解決力や批判的思考が求められる状況に適しています。 Deep モデルは、微妙な推論、複雑な意思決定、詳細な分析が重要な環境で優れています。

地域の入手可能性、機能、ユースケース、コストに基づいてモデルを選 びましょう。 リージョンで使用できるモデルと、モデルの提供終了スケジュールについては、 リージョン別と更新プログラム別のモデル可用性に関するページを確認してください。 価格の詳細については、AI Builder Capability Rate テーブルを参照してください。

モデルの設定

プロンプトビルダーの上部にある3つの点()を選択し、>設定で設定パネルにアクセスできます。 次の設定を行うこともできます:

  • 温度: 温度が低いほど、予測可能な結果が得られます。 温度が高いほど、より多様な応答やクリエイティブな応答が可能になります。
  • レコードの取得: ナレッジ ソースの取得されたレコードの件数。
  • 応答にリンクを含める: 選択すると、取得したレコードのリンク引用が応答に含められます。
  • コードインタプリタを有効にする:選択すると、 コードの生成と実行のためのコードインタプリタ が有効になります。
  • コンテンツモデレーションレベル:最も低いレベルが最も多くの回答を生み出しますが、有害な内容が含まれている場合もあります。 最高レベルのコンテンツモデレーションは、有害なコンテンツを制限するためにより厳格なフィルターを適用し、回答を少なくします。

温度

生成AIモデルの温度はスライダーで設定します。 0から1の範囲です。 この値が生成AIモデルがどれだけ創造性(1)を提供するか、決定論的回答(0)を判断する指標となります。

注意

GPT-5 推論モデルでは温度設定を使用できません。 このため、GPT-5 推論モデルを選択すると、スライダーは無効になります。

温度はAIモデルが生成する出力のランダム性を制御するパラメータです。 温度が低いほど、より予測可能で保守的な出力が得られます。 これに対し、温度が高いほど回答の創造性と多様性が生まれます。 これはモデルの出力におけるランダム性と決定論のバランスを微調整する方法です。

既定では、以前に作成したプロンプトと同様に、温度は 0 です。

温度 機能 用途
0 より予測可能で保守的な出力です。
応答がより一貫性のあるものになります。
高い精度と変動性の低さが求められるプロンプト。
1 回答の創造性と多様性が高まります。
より多様で、時には革新的な対応です。
既成の新しいコンテンツを作成するプロンプト。

温度調整はモデルの出力に影響を与えることがありますが、特定の結果を保証するわけではありません。 AI の応答は本質的に確率的であり、同じ温度設定で変化する可能性があります。

コンテンツモデレーションレベル

スライダーを使ってプロンプトのコンテンツモデレーションレベルを設定します。 モデレーションレベルが低いことで、プロンプトはより多くの回答を提供できます。 しかし、回答数の増加は、プロンプトからの 有害な内容 (憎悪や公平性、性的、暴力、自傷行為)の許容に影響を与える可能性があります。

注意

コンテンツモデレーションレベル設定は管理モデルのみで利用可能です。 このため、Anthropic または Azure AI Foundry モデルを選択すると、スライダーは使用できません。

中介度は から までさまざまです。 プロンプトのデフォルトのモデレーションレベルは 「モデレート」です。

モデレーションが低いと、プロンプトの回答に有害な内容が含まれているリスクが高まります。 より高いモデレーションはそのリスクを下げますが、回答数は減る可能性があります。

コンテンツモデレーションレベル 説明 推奨される使用
Low 憎悪や公平性、性的、暴力、自傷行為を含み、明確かつ深刻な有害な指示、行動、損害、虐待を示す内容を許容する場合があります。 重大な有害行為、極端または違法な害、過激化、同意なしの権力交換や乱用の支持、美化、促進が含まれます。 有害とみなされる可能性のあるデータを処理するプロンプト(例:暴力や医療処置の説明)に利用。
適度 特定のアイデンティティグループに対して、攻撃的、侮辱的、嘲笑的、威圧的、または侮辱的な言葉を用いた、性的・暴力的、自傷行為のコンテンツを許可する場合があります。 有害な指示を求め、実行する描写、空想、美化、中程度の強度での害の促進を含む。 デフォルトのフィルタリングです。 ほとんどの用途に適しています。
High 憎悪や公平性、性的、暴力、自己傷害に関する偏った判断的または意見的な見解を表現する内容を許可する場合があります。 攻撃的な言葉遣い、ステレオタイプ化、架空の世界を探るユースケース(例:ゲーム、文学)、低強度の描写が含まれます。 中程度よりも制限の厳しいフィルターが必要な場合は使ってください。

エージェントでプロンプトを使用する際にエージェントのコンテンツモデレーション設定を上書きするには、プロンプトツールの完了画面で「実行後」設定を「特定のレスポンスを送信(以下に指定)」に設定してください。 表示するメッセージにはOutput.predictionOutput.textのカスタム変数を含めるべきです。

「完了」画面のスクリーンショットで、「特定の回答を送信(下記指定)」設定があります。