ユーザー（一般利用者）向け
- よくあるお問い合わせ
  - デジタルヒューマンを快適に利用するための端末要件
  - インターネット接続は必須ですか？
- トラブルシューティング
  - デジタルヒューマン株式会社のウェブサイト上のソフィーが私の声を聞いていない様です（デジタルヒューマンに声が届かないようです）
  - デジタルヒューマンが私の声を聞いていない様です（デジタルヒューマンに声が届かないようです）
  - デジタルヒューマンが表示されません
  - 画面上にデジタルヒューマン以外のコンテンツが表示されない
  - デジタルヒューマンが画面に表示されていますが、質問しても応答しません
  - 特定の端末や環境で文字化けする
デモコンフィグレーター｜利用ガイド
- はじめに
  - はじめに
  - ログインと認証
  - プロフィール設定
- デモの管理と設定
  - ダッシュボード
  - デモの作成と管理
  - 基本情報とテンプレート
  - 公開設定
  - 設定オプション
  - ライブコンソール
- 管理者ガイド
  - ワークスペースデフォルト設定
  - ダッシュボードとWS管理
  - ユーザー管理
  - グローバルデフォルトと監査ログ
Dify｜会話AI構築ガイド
- はじめに
  - このドキュメントの目的と対象読者
  - Difyとは
  - デジタルヒューマンにおけるDifyの役割
- 初期設定
  - アカウント作成とログイン
  - ワークスペースの作成と設定
  - メンバー招待と権限管理
  - モデルプロバイダーの設定
- ナレッジベースの設定
  - ナレッジベースの概要と設計方針
  - ナレッジベースの作成
  - 知識パイプラインから作成する
  - 外部ナレッジベースと連携
  - チャンク分割とインデックス設定
  - 埋め込みモデルの選択
  - ハイブリッド検索とRerankの活用
  - ナレッジベースのテストと確認
  - テストと精度改善
  - チャットフローへの組み込み方
  - デジタルヒューマン向け最適化のポイント
- チャットフローの作成
  - チャットフローとワークフローの違い
  - チャットフローの新規作成
  - 開始ノードの設定
  - LLMノードの設定
  - ナレッジ検索ノードの設定
  - 質問分類器ノードの活用
  - 条件分岐ノードの設定
  - 変数とコンテキスト管理
  - 会話履歴（メモリ）の設定
  - ペルソナとシステムプロンプト設計
  - デバッグとテスト
  - 公開とAPI連携
- プラグインの拡張
  - プラグインの種類と概要
  - ツールプラグインの導入と設定
  - カスタムプラグインの開発基礎
- 運用・監視・改善
  - ログとトレースの確認
  - アノテーション（注釈）機能
  - 利用状況モニタリング
  - コスト管理とトークン最適化
  - バージョン管理と更新手順
  - トラブルシューティング
- 付録その他
  - 用語集
  - 推奨設定一覧
  - デジタルヒューマン向けチャットフローテンプレート集
  - プロンプトサンプル
  - よくある質問（FAQ）
  - APIサンプルコード
設定・運用
- 概要
  - プラットフォームの概要
  - 世代（Gen1,Gen2,Gen3 / P1,P2）
- ペルソナを設定する（DIP）
  - 設定・制御できる要素
  - 利用できる言語と音声認識・音声合成
  - はじめに
  - ペルソナ一覧
  - ペルソナの追加
  - ペルソナの設定
  - ワークスペース
  - セッションログ
  - サポート
  - 付録
- 制御する
  - ふるまい：概要
  - ふるまい：アクション
  - ふるまい：感情表現
  - ふるまい：カメラ制御
  - ふるまい：生成AI向けサンプルプロンプト
  - 発話制御：SSMLの利用
  - 強制発話：SpeakAPI（スピークAPI）
- 体験をつくる
  - コンテンツ：表示する
  - コンテンツ：使用可能なHTMLタグ
  - コンテンツ：エディタ（コマンドエディタ）
  - スタートボタン：オリジナルのボタンを実装する
  - カスタムメタデータ：フロントエンドと会話AI間で情報をやり取りする
  - PTT：プッシュトゥトークモードを使用する
  - サジェステッドレスポンス:表示する
- 会話AI チャットボットと接続する
  - 接続実績のある会話AI・チャットボット
  - 会話AIやチャットボットとの接続を変更する
  - NLP プロファイル共通パラメータ
  - Dify と接続する
  - Dify で使える実装Tips集
  - miibo と接続する
  - Kore.ai と接続する
  - Allganize Alli と接続する
- トラブルシューティング
  - ログの確認方法、ログイベント一覧、セッションIDの取得
  - デジタルヒューマンプラットフォームの稼働状況
  - 解像度・通信量・帯域幅を確認する
  - WebRTCネットワーク診断ガイド（パケットロス調査）
  - デジタルヒューマンが画面に表示されません
  - デジタルヒューマンがフリーズしたり、同期が取れなくなりました
開発・設置
- 概要とネットワーク
  - プラットフォームの概要
  - ファイアウォール・ネットワーキングとWebRTC + TURN
- ホステッドエクスペリエンス
  - 概要
  - ビューの種類
  - 設置手順
  - 設定オプション
  - 表示文字列（多言語対応）
  - コードスニペットサンプル
  - イベント
  - メソッド
  - セキュリティ保護
  - マルチプル表示
- ミニプレム（MiniPrem）
  - 必ずお読みください
  - 環境準備
  - ファイアウォール設定
  - インストール
  - 操作ガイド
  - トラブルシュート
  - アップデート
- 会話AI・チャットボットとの接続
  - 会話AI・チャットボットとのプラットフォームインテグレーションの概要
  - 会話AI・チャットボットに求めるレスポンス例・機能
  - 独自LLMとデジタルヒューマンを接続する
  - 接続元IPアドレス
- BYO STTとTTS
  - BYO TTSを利用する（DHKKゲートウェイ）
カスタマー・パートナー向け
- リリースノート
  - リリースノート
- 契約・申込み
  - デジタルヒューマンを試してみたい（デモと2週間の無料試用が可能です）
  - アニメ・2Dのキャラクターをデジタルヒューマンのプラットフォームで利用できますか？
  - オリジナルキャラクター/クローンキャラクターを作成するには
  - ユーザー・カスタマー・パートナー・ベンダー・サプライヤーの位置づけについて
  - 導入支援してほしい
Terms, Privacy and Legal
- 文書一覧
  - 利用規約
  - フリートライアル利用規約
  - サービスレベルアグリーメント
  - プライバシーポリシー（個人情報保護方針）
  - 情報セキュリティ方針
More

設定・制御できる要素

configurable-elements

このページの目的

デジタルヒューマンおよびデジタルヒューマンプラットフォームは、自由度が高いプラットフォームです。このページでは、変更、設定、制御できる要素を一覧しています。

プラットフォーム概要図

アニメーションプラットフォーム

標準設定項目

デジタルヒューマンのキャラクターや背景の変更、接続する会話AI/チャットボットなどの設定をまとめた単位（インスタンス）を「ペルソナ」と呼んでいます。以下は標準の設定項目です。

項目	タイプ	備考
管理用名	文字列	ペルソナの管理用名
キャラクターの外見	文字列	プランによって利用できるキャラクターが異なります。キャラクターレベルを設定することで指定できます。
背景	文字列	背景画像を選択可能です。背景URLを設定することで背景を変更できます。
API URL	文字列	会話AIのAPIエンドポイントか、会話AIが接続されたオーケストレーション・ゲートウェイのエンドポイントを設定します。
音声認識（STT）	選択	link を参照してください。
音声合成（TTS）	選択	Google Cloud, Microsoft Azure, ElevenLabs の話者が設定できます。

カスタム設定項目

標準設定できない拡張設定は以下の通りです。設定はすべて弊社にて行います。

項目	タイプ	備考
キャラクターの外見	カスタム設定	弊社側で設定します。
カスタム音声認識（BYO STT）	カスタム設定	BYO/サードパーティー音声認識を利用できます。標準で使えるSTTプロバイダーでもアニメーションプラットフォームを経由させたく無い場合にも利用できます。
カスタム音声合成（BYO TTS）	カスタム設定	~~BYO/サードパーティー音声合成を利用できます。~~ P2ではAzureのカスタムニューラルボイスのみ対応します。

フロントエンド

会話AIやチャットボットから制御可能な項目

フロントエンドは表示の形によって利用できる機能が変わります。ビューの種類はこちらをご覧下さい。デジタルヒューマンは自律的にアニメーションを生成しますが、チャットボットやNLPから制御できる項目は以下です。

項目	タイプ	備考
発話内容	文字列	デジタルヒューマンに喋らせたい内容
声	発話の制御：SSMLの利用	デジタルヒューマンが発話する際の、声の早さ、ピッチ、ブレイク、読み方などはSSMLで制御可能です。SSMLは合成音声プロバイダーである程度共通化されていますが、完全に統一されていませんので、利用するプロバイダーによって利用できるSSMLタグが変わります。
感情表現	ふるまいの変更：感情表現編	デジタルヒューマンの表情は自律的に生成されますが、幸せや興奮等の感情を付与して表現する事が出来ます。
手足等のアクション制御	ふるまいの変更：アクション編	デジタルヒューマンGen3からは、空間の概念がうまれ3D移動（対応予定）や手足を使ったアクション表現等が制御出来るようになりました。
カメラ制御（アバターの表示位置）	ふるまいの変更：カメラ制御編	デジタルヒューマンを撮影しているカメラが利用出来、ズーム・ズームアウト・パンチルトが利用出来るようになります。
ビューのコンポーネント	コマンド	各ビューに依存します。ビューの種類はこちらをご覧下さい。
ユーザや環境認識用のWebカメラ	環境依存	話者を撮影するカメラ、またはカメラを使った解析・認識・認証の機能はデジタルヒューマンプラットフォームとして提供しておらず、外部のサービスとの連携になります。詳しくはお問い合わせください。

対話AI/チャットボット

ChatGPTをはじめ、さまざまな対話AIやチャットボットが接続可能です。接続するための仕様は下記をこちらをご覧下さい。

接続実績のある会話AI・チャットボット

会話AI・チャットボットとのプラットフォームインテグレーションの概要

お役に立ちましたか？

😞

😐

🤩

最終更新日 October 26, 2025

世代（Gen1,Gen2,Gen3 / P1,P2）利用できる言語と音声認識・音声合成