# モデルプロバイダーの設定

## モデルプロバイダーとは

DifyでAIアプリケーションを作成するには、**モデルプロバイダー**（AIモデルの提供元）を設定する必要があります。特にリアルタイム対話が重要なデジタルヒューマンでは、**GPT-5.2**と**Gemini 3 Flash**が最速で推奨されます。

## 対応している主なプロバイダー例

| プロバイダー           | 代表的なモデル                                              | 特徴                                 |
| ---------------- | ---------------------------------------------------- | ---------------------------------- |
| **OpenAI**       | GPT-5.2, GPT-5, GPT-4.5                              | 最高速の推論速度、統合システム、実績豊富               |
| **Google**       | Gemini 3 Pro, Gemini 3 Flash, Gemini 2.5 Pro         | マルチモーダル、超長文コンテキスト（1M）、3 Flashは超高速  |
| **Anthropic**    | Claude Opus 4.5, Claude Sonnet 4.5, Claude Haiku 4.5 | 最高のコーディング性能、長文対応、安全性               |
| **Azure OpenAI** | GPTシリーズ（OpenAIと同等）                                   | エンタープライズ向け、SLA保証、コンプライアンス          |
| **AWS Bedrock**  | Claude, Titan, Llama 3など                             | AWSエコシステム連携、柔軟なモデル選択               |
| **Groq**         | Llama 3.3, DeepSeek, Mixtral                         | LPU推論エンジン、超低レイテンシー、1,500+ tokens/s |
| **Cerebras**     | Llama 4, GPT-OSS, Qwen                               | ウェーハースケールAI、業界最速、2,500+ tokens/s   |
| **ローカルLLM**      | Ollama, LocalAI                                      | オンプレミス運用、コスト固定、データ保護               |

## 設定手順（OpenAIの例）

### ステップ1: 設定画面を開く

![](/files/OfwUp4G31uFvbJd0MTkw)

1. 画面右上の「プラグイン」をクリック
2. 「モデルプロバイダー」インストール元を選択
   * マーケットプレイス
   * GitHub
   * ローカルパッケージファイル

![](/files/csIgkUKhwsJtG0IMzKQ7)

{% hint style="info" %}
モデルプロバイダーは、「設定」→「モデルプロバイダー」画面の下部からも同様に追加できます。
{% endhint %}

### ステップ2: プロバイダーの追加

![](/files/5Vgei2VXP3VRdhxKe2ie)

![](/files/NkP4ic90ofDMLlhvPKO0)

1. 「モデル」をクリック
2. 一覧から「OpenAI」を選択
3. インストールをクリック
4. インストールが完了すればモデルが使用できるようになります

### ステップ3: APIキーの取得

1. 生成されたAPIキーをコピー
2. キーを安全な場所に保管

![](/files/KZz8GMEPsBIJOZahTYXC)

**OpenAI（Chat-GPT）の場合:**

1. <https://auth.openai.com/log-in> にアクセス
2. ログイン後に、設定 > 左メニュー「[API Keys](https://gitlab.digitalhumans.jp/docs/docs-digitalhumansjp/-/blob/main/dify-guide/setup/enai.com/settings/organization/api-keys/README.md)」メニューを選択
3. 「Create new secret key」をクリック
4. 生成されたキーをコピー

![](/files/Wd0lOn88BGLBxHnTkpym)

**Anthropic（Claude）の場合:**

1. <https://console.anthropic.com> にアクセス
2. 「[API Keys](https://console.anthropic.com/settings/keys)」を選択
3. 「Create Key」をクリック

![Google AI Studio APIキー取得画面](/files/v4D5XfTnSayVPeyRXkMh)

Google AI Studio APIキー取得画面

**Google（Gemini）の場合:**

1. [Google AI Studio](https://aistudio.google.com/) にアクセス
2. Googleアカウントでログイン
3. 画面上部の「Get API key」をクリック
4. 「Create API key」をクリック
   * 既存のGoogle Cloudプロジェクトがある場合：「Create API key in existing project」を選択
   * 新規プロジェクトの場合：「Create API key in new project」を選択（推奨）

### ステップ4: 接続テスト

![CleanShot 2025-12-24 at 11.29.54.png](/files/n0IYXrTWRGfopwgaeB9L)

1. Difyのプラグイン設定画面に戻り、APIキーを入力後、「テスト」ボタンをクリック
2. 成功メッセージが表示されれば設定完了
3. 「保存」をクリック

## デジタルヒューマン向けモデルの参考

速度と精度のバランスでモデルを選定してください。特に、全文が出力される速度よりも、応答が始まるまでの時間（厳密には1文目が出力されるまでの時間）が早いモデルをおすすめします。

**応答速度の目安:**

* ⚡⚡⚡ 超高速: 50〜2000+ tokens/秒（0.3〜1秒、リアルタイム対話に最適）
* ⚡⚡ 高速: 30〜50 tokens/秒（1〜2秒、一般的な会話に十分）
* ⚡ 標準: 10〜30 tokens/秒（2〜4秒、複雑な処理向け）

※ 応答が生成されてから、転送にかかる時間、音声合成とアニメーションを生成する時間がオーバーヘッドとして必要になります。

### LLM（会話用）

| モデル                           | 用途            | 応答速度                     | 特徴                                       |
| ----------------------------- | ------------- | ------------------------ | ---------------------------------------- |
| **Cerebras Llama 4 Maverick** | 本番用（業界最速）     | ⚡⚡⚡ 超高速（2,500+ tokens/s） | ウェーハースケールAIチップ、推論速度世界記録                  |
| **Gemini 3 Flash**            | 本番用（最速）       | ⚡⚡⚡ 超高速（2000+ tokens/s）  | 2025年12月リリース、リアルタイム対話に最適、最先端知能           |
| **Groq Llama 3.3 70B**        | 本番用（超低レイテンシー） | ⚡⚡⚡ 超高速（1,500+ tokens/s） | LPU推論エンジン、オープンソースモデルで最速クラス               |
| **GPT-5.2**                   | 本番用（最高性能）     | ⚡⚡⚡ 超高速（187 tokens/s）    | 2025年12月リリース、全分野で最先端、高速と深い推論を自動切替        |
| **GPT-4.1 mini**              | 本番用（コスパ最強）    | ⚡⚡⚡ 超高速（89 tokens/s）     | 2025年4月リリース、GPT-4o同等性能でレイテンシー半分、コスト83%削減 |
| **Claude Haiku 4.5**          | 本番用（軽量・低コスト）  | ⚡⚡⚡ 超高速                  | 2025年7月リリース、シンプルな対話・FAQ向け                |
| **Claude Opus 4.5**           | 本番用（コーディング最強） | ⚡⚡ 高速（50 tokens/s）       | 2025年11月リリース、SWE-bench 80.9%達成、長時間タスク対応  |
| **GPT-5**                     | 本番用（汎用）       | ⚡⚡⚡ 超高速                  | 2025年8月リリース、統合システム、専門家レベルの知性             |
| **Claude Sonnet 4.5**         | 本番用（バランス型）    | ⚡⚡ 高速                    | 2025年9月リリース、自然な応答、コーディング性能高              |
| **Gemini 3 Pro**              | 本番用（マルチモーダル）  | ⚡⚡ 高速                    | 2025年11月リリース、画像・音声・動画対応、1Mトークンコンテキスト     |
| **Gemini 2.5 Pro**            | 本番用（コーディング）   | ⚡⚡ 高速                    | 2025年5月リリース、コーディング特化、Deep Thinkモード       |

### 埋め込みモデル（ナレッジベース用）

| モデル                        | 特徴            |
| -------------------------- | ------------- |
| **text-embedding-3-large** | OpenAIの高精度モデル |
| **text-embedding-3-small** | コスト重視の場合      |
| **bge-m3**                 | 多言語対応、日本語に強い  |

### Rerankモデル（検索精度向上）

| モデル                          | 提供元    |
| ---------------------------- | ------ |
| **rerank-multilingual-v3.0** | Cohere |
| **bge-reranker-v2-m3**       | BAAI   |

## デフォルトモデルの設定

アプリケーション作成時のデフォルトモデルを設定できます：

### 設定方法

1. モデルプロバイダー設定を開く
2. 各モデルの右側にある「デフォルトに設定」を有効化

### 推奨デフォルト設定例

| 種別                | 推奨モデル                    |
| ----------------- | ------------------------ |
| **システム推論モデル**     | GPT-5.2                  |
| **埋め込みモデル**       | text-embedding-3-large   |
| **Rerank モデル**    | rerank-multilingual-v3.0 |
| **音声-to-テキストモデル** | （デジタルヒューマンでは使用しません)      |
| **テキスト-to-音声モデル** | （デジタルヒューマンでは使用しません)      |

目的に応じて複数のプロバイダーを設定できます：

```
例:
- OpenAI: GPT-4o（メインLLM）
- OpenAI: text-embedding-3-large（埋め込み）
- Cohere: rerank-multilingual-v3.0（Rerank）
```

## セキュリティ上の注意

1. **APIキーの管理**
   * キーは厳重に管理、共有しない
   * 定期的にローテーション推奨
2. **利用制限の設定**
   * 各プロバイダーで利用上限を設定
   * 予期せぬコスト超過を防止
3. **バックアッププロバイダー**
   * 主要プロバイダー障害時の代替を用意
   * 予算オーバー時の代替を用意


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.digitalhumans.jp/dify-guide/setup/dify-docs-configure-model-provider.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.