ユーザー（一般利用者）向け
- よくあるお問い合わせ
  - デジタルヒューマンを快適に利用するための端末要件
  - インターネット接続は必須ですか？
- トラブルシューティング
  - デジタルヒューマン株式会社のウェブサイト上のソフィーが私の声を聞いていない様です（デジタルヒューマンに声が届かないようです）
  - デジタルヒューマンが私の声を聞いていない様です（デジタルヒューマンに声が届かないようです）
  - デジタルヒューマンが表示されません
  - 画面上にデジタルヒューマン以外のコンテンツが表示されない
  - デジタルヒューマンが画面に表示されていますが、質問しても応答しません
  - 特定の端末や環境で文字化けする
クイックスタートガイド
- はじめに
  - はじめに
  - あなたの環境タイプは？
- デモ環境
  - クイックスタート
  - システムの構成
  - Webサイト / アプリ（フロントエンド）
- フリートライアル
  - 会話AIの設定
  - キャラクターの変更とオリジナルキャラクターの作成
- 本番導入
  - 独自ドメインへの設置と追加カスタマイズ
デモコンフィグレーター｜利用ガイド
- はじめに
  - はじめに
  - ログインと認証
  - プロフィール設定
- デモの管理と設定
  - ダッシュボード
  - デモの作成と管理
  - 基本情報とテンプレート
  - 公開設定
  - 設定オプション
  - ライブコンソール
- 管理者ガイド
  - ワークスペースデフォルト設定
  - ダッシュボードとWS管理
  - ユーザー管理
  - グローバルデフォルトと監査ログ
Dify｜会話AI構築ガイド
- はじめに
  - このドキュメントの目的と対象読者
  - Difyとは
  - デジタルヒューマンにおけるDifyの役割
- 初期設定
  - アカウント作成とログイン
  - ワークスペースの作成と設定
  - メンバー招待と権限管理
  - モデルプロバイダーの設定
- ナレッジベースの設定
  - ナレッジベースの概要と設計方針
  - ナレッジベースの作成
  - 知識パイプラインから作成する
  - 外部ナレッジベースと連携
  - チャンク分割とインデックス設定
  - 埋め込みモデルの選択
  - ハイブリッド検索とRerankの活用
  - ナレッジベースのテストと確認
  - テストと精度改善
  - チャットフローへの組み込み方
  - デジタルヒューマン向け最適化のポイント
- チャットフローの作成
  - チャットフローとワークフローの違い
  - チャットフローの新規作成
  - 開始ノードの設定
  - LLMノードの設定
  - ナレッジ検索ノードの設定
  - 質問分類器ノードの活用
  - 条件分岐ノードの設定
  - 変数とコンテキスト管理
  - 会話履歴（メモリ）の設定
  - ペルソナとシステムプロンプト設計
  - デバッグとテスト
  - 公開とAPI連携
- プラグインの拡張
  - プラグインの種類と概要
  - ツールプラグインの導入と設定
  - カスタムプラグインの開発基礎
- 運用・監視・改善
  - ログとトレースの確認
  - アノテーション（注釈）機能
  - 利用状況モニタリング
  - コスト管理とトークン最適化
  - バージョン管理と更新手順
  - トラブルシューティング
- 付録・その他
  - 用語集
  - 推奨設定一覧
  - デジタルヒューマン向けチャットフローテンプレート集
  - プロンプトサンプル
  - よくある質問（FAQ）
  - APIサンプルコード
設定・運用
- 概要
  - プラットフォームの概要
  - 世代（Gen1,Gen2,Gen3 / P1,P2）
- ペルソナを設定する（DIP）
  - 設定・制御できる要素
  - 利用できる言語と音声認識・音声合成
  - はじめに
  - ペルソナ一覧
  - ペルソナの追加
  - ペルソナの設定
  - ワークスペース
  - セッションログ
  - サポート
  - 付録
- 制御する
  - ふるまい：概要
  - ふるまい：アクション
  - ふるまい：感情表現
  - ふるまい：カメラ制御
  - ふるまい：生成AI向けサンプルプロンプト
  - 発話制御：SSMLの利用
  - 強制発話：SpeakAPI（スピークAPI）
- 体験をつくる
  - コンテンツ：表示する
  - コンテンツ：使用可能なHTMLタグ
  - コンテンツ：エディタ（コマンドエディタ）
  - スタートボタン：オリジナルのボタンを実装する
  - カスタムメタデータ：フロントエンドと会話AI間で情報をやり取りする
  - PTT：プッシュトゥトークモードを使用する
  - サジェステッドレスポンス:表示する
- 会話AI チャットボットと接続する
  - 接続実績のある会話AI・チャットボット
  - 会話AIやチャットボットとの接続を変更する
  - NLP プロファイル共通パラメータ
  - Dify と接続する
  - Dify で使える実装Tips集
  - miibo と接続する
  - Kore.ai と接続する
  - Allganize Alli と接続する
- トラブルシューティング
  - ログの確認方法、ログイベント一覧、セッションIDの取得
  - デジタルヒューマンプラットフォームの稼働状況
  - 解像度・通信量・帯域幅を確認する
  - WebRTCネットワーク診断ガイド（パケットロス調査）
  - デジタルヒューマンが画面に表示されません
  - デジタルヒューマンがフリーズしたり、同期が取れなくなりました
開発・設置
- 概要とネットワーク
  - プラットフォームの概要
  - ファイアウォール・ネットワーキングとWebRTC + TURN
- ホステッドエクスペリエンス
  - 概要
  - ビューの種類
  - 設置手順
  - 設定オプション
  - 表示文字列（多言語対応）
  - コードスニペットサンプル
  - イベント
  - メソッド
  - セキュリティ保護
  - マルチプル表示
- ミニプレム（MiniPrem）
  - 必ずお読みください
  - 環境準備
  - ファイアウォール設定
  - インストール
  - 操作ガイド
  - トラブルシュート
  - アップデート
- 会話AI・チャットボットとの接続
  - 会話AI・チャットボットとのプラットフォームインテグレーションの概要
  - 会話AI・チャットボットに求めるレスポンス例・機能
  - 独自LLMとデジタルヒューマンを接続する
  - 接続元IPアドレス
- BYO STTとTTS
  - BYO TTSを利用する（DHKKゲートウェイ）
カスタマー・パートナー向け
- リリースノート
  - リリースノート
- 契約・申込み
  - デジタルヒューマンを試してみたい（デモと2週間の無料試用が可能です）
  - アニメ・2Dのキャラクターをデジタルヒューマンのプラットフォームで利用できますか？
  - オリジナルキャラクター/クローンキャラクターを作成するには
  - ユーザー・カスタマー・パートナー・ベンダー・サプライヤーの位置づけについて
  - 導入支援してほしい
Terms, Privacy and Legal
- 文書一覧
  - 利用規約
  - フリートライアル利用規約
  - サービスレベルアグリーメント
  - プライバシーポリシー（個人情報保護方針）
  - 情報セキュリティ方針
More

推奨設定一覧

dify-docs-recommended-settings

デジタルヒューマンの実装において重要となる「応答速度（低遅延）」「人格の一貫性」「コストパフォーマンス」を考慮した Dify 推奨設定です。

1. LLM 設定

1.1 モデル選定（2025-2026年の標準）

従来の GPT-3.5 / GPT-4 から、より高速・安価・高性能なモデルへの移行を強く推奨します。

GPT-4o (OpenAI):

推奨用途: メインの会話モデル。応答速度が非常に速く、感情表現も豊か。日本語の流暢さと速度のバランスが現在最適です。

GPT-4o-mini (OpenAI):

推奨用途: コスト重視、または挨拶や単純な応答。

理由: GPT-3.5-turbo よりも安価で高性能かつ高速です。

Claude 3.5 Sonnet (Anthropic):

推奨用途: より人間らしく、温かみのある対話が必要な場合。

1.2 推奨パラメータ

デジタルヒューマンは「即答性」と「キャラ崩壊の防止」が重要です。

Temperature: 0.5〜0.7

解説: 0.3だと機械的になりすぎるため、少し揺らぎを持たせます。人格プロンプトで制御できている前提です。

max_tokens: 300〜500

解説: 長文回答は音声合成（TTS）の待ち時間を増やし、ユーザーを飽きさせます。短くテンポの良い会話を強制するため、あえて少なめに設定することを推奨します。

2. ナレッジベース設定（RAG）

2.1 埋め込みモデル（Embedding）

古いモデル（ada-002等）は精度・コスト面で推奨されなくなっています。

推奨モデル:

text-embedding-3-large (OpenAI): 精度重視。

text-embedding-3-small (OpenAI): 速度・コスト重視。

multilingual-e5-large: 日本語特化の精度が必要な場合。

2.2 検索設定

Top K: 3〜5

解説: コンテキストが長くなると LLM の処理時間（TTFT）が増加します。必要最小限に絞ります。

Score Threshold: 0.6〜0.7

解説: 無関係な知識を無理やり話させないために、閾値はやや高めを設定します。

3. API 連携・応答モード設定（重要）

デジタルヒューマンにおいて最も重要な設定項目です。

応答モード: Streaming（ストリーミング）推奨

理由: blockingモードでは、文章生成が完了するまで音声合成を開始できず、数秒の「無言時間」が発生します。streamingを使用し、最初の数文字が届いた時点で音声合成やモーション生成を開始するパイプラインを構築するのが、現代のデジタルヒューマンの基本実装です。

会話履歴（Memory）: Window Memory（直近 5〜10 ターン）

解説: 履歴が長すぎるとプロンプト処理が重くなります。また、話題転換への追従性を高めるためにも、あまり古い履歴は引きずらない設定が好ましいです。

4. プロンプト設計のヒント

設定値だけでなく、システムプロンプトで以下の制約を加えると品質が安定します。

「回答は1〜2文で簡潔に答えてください。」（TTS生成時間の短縮）

「あなたは〜です。〜という口調で話してください。」（役割の固定）

「分からないことは無理に答えず、正直に分からないと言ってください。」（ハルシネーション対策）

5. ユースケース別プリセット

用途	モデル	Temperature	応答モード	特記事項
受付・案内	GPT-4o-mini	0.3	Streaming	速度と正確性最優先。RAG必須。
雑談・フリートーク	GPT-4o / Claude 3.5 Sonnet	0.7	Streaming	共感性重視。メモリ多め。
専門コンサル	GPT-4o	0.5	Streaming	正確性重視。Rerank有効化。

お役に立ちましたか？

😞

😐

🤩

最終更新日 March 3, 2026

用語集デジタルヒューマン向けチャットフローテンプレート集