ユーザー（一般利用者）向け
- よくあるお問い合わせ
  - デジタルヒューマンを快適に利用するための端末要件
  - インターネット接続は必須ですか？
- トラブルシューティング
  - デジタルヒューマン株式会社のウェブサイト上のソフィーが私の声を聞いていない様です（デジタルヒューマンに声が届かないようです）
  - デジタルヒューマンが私の声を聞いていない様です（デジタルヒューマンに声が届かないようです）
  - デジタルヒューマンが表示されません
  - 画面上にデジタルヒューマン以外のコンテンツが表示されない
  - デジタルヒューマンが画面に表示されていますが、質問しても応答しません
  - 特定の端末や環境で文字化けする
クイックスタートガイド
- はじめに
  - はじめに
  - あなたの環境タイプは？
- デモ環境
  - クイックスタート
  - システムの構成
  - Webサイト / アプリ（フロントエンド）
- フリートライアル
  - 会話AIの設定
  - キャラクターの変更とオリジナルキャラクターの作成
- 本番導入
  - 独自ドメインへの設置と追加カスタマイズ
デモコンフィグレーター｜利用ガイド
- はじめに
  - はじめに
  - ログインと認証
  - プロフィール設定
- デモの管理と設定
  - ダッシュボード
  - デモの作成と管理
  - 基本情報とテンプレート
  - 公開設定
  - 設定オプション
  - ライブコンソール
- 管理者ガイド
  - ワークスペースデフォルト設定
  - ダッシュボードとWS管理
  - ユーザー管理
  - グローバルデフォルトと監査ログ
Dify｜会話AI構築ガイド
- はじめに
  - このドキュメントの目的と対象読者
  - Difyとは
  - デジタルヒューマンにおけるDifyの役割
- 初期設定
  - アカウント作成とログイン
  - ワークスペースの作成と設定
  - メンバー招待と権限管理
  - モデルプロバイダーの設定
- ナレッジベースの設定
  - ナレッジベースの概要と設計方針
  - ナレッジベースの作成
  - 知識パイプラインから作成する
  - 外部ナレッジベースと連携
  - チャンク分割とインデックス設定
  - 埋め込みモデルの選択
  - ハイブリッド検索とRerankの活用
  - ナレッジベースのテストと確認
  - テストと精度改善
  - チャットフローへの組み込み方
  - デジタルヒューマン向け最適化のポイント
- チャットフローの作成
  - チャットフローとワークフローの違い
  - チャットフローの新規作成
  - 開始ノードの設定
  - LLMノードの設定
  - ナレッジ検索ノードの設定
  - 質問分類器ノードの活用
  - 条件分岐ノードの設定
  - 変数とコンテキスト管理
  - 会話履歴（メモリ）の設定
  - ペルソナとシステムプロンプト設計
  - デバッグとテスト
  - 公開とAPI連携
- プラグインの拡張
  - プラグインの種類と概要
  - ツールプラグインの導入と設定
  - カスタムプラグインの開発基礎
- 運用・監視・改善
  - ログとトレースの確認
  - アノテーション（注釈）機能
  - 利用状況モニタリング
  - コスト管理とトークン最適化
  - バージョン管理と更新手順
  - トラブルシューティング
- 付録・その他
  - 用語集
  - 推奨設定一覧
  - デジタルヒューマン向けチャットフローテンプレート集
  - プロンプトサンプル
  - よくある質問（FAQ）
  - APIサンプルコード
設定・運用
- 概要
  - プラットフォームの概要
  - 世代（Gen1,Gen2,Gen3 / P1,P2）
- ペルソナを設定する（DIP）
  - 設定・制御できる要素
  - 利用できる言語と音声認識・音声合成
  - はじめに
  - ペルソナ一覧
  - ペルソナの追加
  - ペルソナの設定
  - ワークスペース
  - セッションログ
  - サポート
  - 付録
- 制御する
  - ふるまい：概要
  - ふるまい：アクション
  - ふるまい：感情表現
  - ふるまい：カメラ制御
  - ふるまい：生成AI向けサンプルプロンプト
  - 発話制御：SSMLの利用
  - 強制発話：SpeakAPI（スピークAPI）
- 体験をつくる
  - コンテンツ：表示する
  - コンテンツ：使用可能なHTMLタグ
  - コンテンツ：エディタ（コマンドエディタ）
  - スタートボタン：オリジナルのボタンを実装する
  - カスタムメタデータ：フロントエンドと会話AI間で情報をやり取りする
  - PTT：プッシュトゥトークモードを使用する
  - サジェステッドレスポンス:表示する
- 会話AI チャットボットと接続する
  - 接続実績のある会話AI・チャットボット
  - 会話AIやチャットボットとの接続を変更する
  - NLP プロファイル共通パラメータ
  - Dify と接続する
  - Dify で使える実装Tips集
  - miibo と接続する
  - Kore.ai と接続する
  - Allganize Alli と接続する
- トラブルシューティング
  - ログの確認方法、ログイベント一覧、セッションIDの取得
  - デジタルヒューマンプラットフォームの稼働状況
  - 解像度・通信量・帯域幅を確認する
  - WebRTCネットワーク診断ガイド（パケットロス調査）
  - デジタルヒューマンが画面に表示されません
  - デジタルヒューマンがフリーズしたり、同期が取れなくなりました
開発・設置
- 概要とネットワーク
  - プラットフォームの概要
  - ファイアウォール・ネットワーキングとWebRTC + TURN
- ホステッドエクスペリエンス
  - 概要
  - ビューの種類
  - 設置手順
  - 設定オプション
  - 表示文字列（多言語対応）
  - コードスニペットサンプル
  - イベント
  - メソッド
  - セキュリティ保護
  - マルチプル表示
- ミニプレム（MiniPrem）
  - 必ずお読みください
  - 環境準備
  - ファイアウォール設定
  - インストール
  - 操作ガイド
  - トラブルシュート
  - アップデート
- 会話AI・チャットボットとの接続
  - 会話AI・チャットボットとのプラットフォームインテグレーションの概要
  - 会話AI・チャットボットに求めるレスポンス例・機能
  - 独自LLMとデジタルヒューマンを接続する
  - 接続元IPアドレス
- BYO STTとTTS
  - BYO TTSを利用する（DHKKゲートウェイ）
カスタマー・パートナー向け
- リリースノート
  - リリースノート
- 契約・申込み
  - デジタルヒューマンを試してみたい（デモと2週間の無料試用が可能です）
  - アニメ・2Dのキャラクターをデジタルヒューマンのプラットフォームで利用できますか？
  - オリジナルキャラクター/クローンキャラクターを作成するには
  - ユーザー・カスタマー・パートナー・ベンダー・サプライヤーの位置づけについて
  - 導入支援してほしい
Terms, Privacy and Legal
- 文書一覧
  - 利用規約
  - フリートライアル利用規約
  - サービスレベルアグリーメント
  - プライバシーポリシー（個人情報保護方針）
  - 情報セキュリティ方針
More

埋め込みモデルの選択

dify-docs-choose-embedding-model

埋め込みモデルとは

埋め込みモデル（Embedding Model）は、テキストを固定長の数値ベクトル（埋め込みベクトル）に変換するAIモデルです。ベクトル同士の距離（コサイン類似度など）を計算することで、テキスト間の意味的な近さを定量的に比較できます。

埋め込みのイメージ

埋め込みとは、テキストの意味を捉えた高次元（数百〜数千次元）の数値ベクトルです。

例えば、

「犬」と「猫」→ どちらもペット・動物なので、ベクトル空間上で近い位置に配置

「犬」と「自動車」→ 意味的に関連が薄いため、遠い位置に配置

このベクトル化により、単純なキーワード一致だけでなく、意味的に類似した文書の検索（セマンティック検索）が可能になります。

主な用途

RAG（検索拡張生成）：生成AIが回答するための関連文書検索

セマンティック検索：表記揺れや同義語に対応した情報検索

分類・クラスタリング：文書の自動分類やグルーピング

レコメンデーション：類似記事や類似商品の提案

代表的な埋め込みモデルの候補

現在主流のモデルは以下の通りです。用途とコストに合わせて選定してください。

1. OpenAI (text-embedding-3 シリーズ)

業界標準として広く利用されています。前世代（ada-002）と比較して性能が向上し、コストが低下しています。

text-embedding-3-small

特徴: 高速かつ非常に低コスト、一般的な用途には十分な性能

次元数: 1536

text-embedding-3-large

特徴: 高精度、多言語や複雑なタスクでより良い性能発揮、smallより高価

次元数: 3072

2. Cohere (Embed v3 シリーズ)

検索品質（Rerank等との組み合わせ）や多言語対応に強みを持ちます。

embed-multilingual-v3.0

特徴: 100以上の言語対応、日本語の精度高、検索用途に特化した学習

次元数: 1024

3. Google (Vertex AI text-embedding シリーズ)

Google Cloud環境を利用している場合に親和性が高いモデルです。

text-embedding-004 (Gecko系)

特徴: 多言語対応（日本語含む）、タスクタイプ（検索クエリ、文書、分類など）を指定して埋め込みを生成できる機能搭載

次元数: 768

4. オープンソース / ローカルモデル

Hugging Face等で公開されているモデルを自社サーバーで運用する場合です。

代表例: E5 (multilingual-e5)、BGE (BAAI General Embedding) シリーズ

メリット: データが外部に出ない、ランニングコストが計算リソースのみ

デメリット: インフラ構築・保守の手間が発生

モデル選定のポイント

1. 言語対応能力

日本語特有の文脈理解が必要な場合、多言語モデル（Multilingual）の性能評価（MTEBリーダーボードの日本語スコアなど）を確認するか、実データで検証することが推奨されます。

2. 精度・速度・コストのバランス

高精度なモデル（次元数が大きいモデル）は、ベクトルDBのストレージ容量と検索計算コストを増加させます。大規模なナレッジベース（数百万件以上）の場合、保存コストとレイテンシへの影響が大きくなるため、smallモデルや量子化技術の検討が必要です。

3. ベクトルDBとの適合性

利用するベクトルデータベースが推奨する次元数や距離関数（コサイン類似度、ドット積など）を確認してください。OpenAIの新しいモデルなどは次元数を短縮（短縮しても性能劣化が少ない）する機能を持つものもあります。

導入・運用上の注意

一度選定したモデルは変更が困難

埋め込みモデルを変更する場合、データベース内の全ドキュメントを新しいモデルで再度ベクトル化（Re-indexing）する必要があります。運用途中での変更はコストと時間がかかるため、初期の選定と小規模なPoC（概念実証）が重要です。

ハイブリッド検索の推奨

ベクトル検索だけでは「品番」や「固有名詞」の完全一致検索に弱い場合があります。実運用では、ベクトル検索（意味）＋キーワード検索（語句）を組み合わせたハイブリッド検索の実装を強く推奨します。

設定手順（一般的な流れ）

モデル選定: 要件（精度・コスト・言語）に基づきモデルを決定

チャンク化: 文書を適切な長さ（例: 500~1000文字）に分割

埋め込み生成: API等を通じてベクトルデータを取得

DB保存: ベクトルDBにメタデータと共に保存

検索テスト: 想定される質問で検索精度を確認し、必要に応じてチャンクサイズや検索パラメータ（TopK, 閾値）を調整

埋め込みモデルの設定

設定手順

ナレッジベース作成時に埋め込みモデルを選択

またはドキュメント追加時に選択

注意事項

一度設定した埋め込みモデルは後から変更不可

変更する場合はナレッジベースの再作成が必要

※DHKK 環境では設定画面にドロップダウン形式でモデルが表示されますが、ナレッジベース作成後は変更できません。初期設定時に慎重に選択してください。変更が必要な場合はナレッジベースを再作成する必要があります。

同じアプリ内で異なる埋め込みモデルのナレッジを混在可能

お役に立ちましたか？

😞

😐

🤩

最終更新日 March 3, 2026

チャンク分割とインデックス設定ハイブリッド検索とRerankの活用