検索設定(リトリーバル設定)
ナレッジベースの検索方法と各設定項目について解説します。
検索方法の種類
Difyでは3つの検索方法を選択できます:
1. Vector Search(ベクトル検索)
項目 | 内容 |
仕組み | 埋め込みベクトルの類似度計算 |
強み | 意味的に似た内容を検索 |
弱み | キーワード完全一致は苦手 |
2. Full-Text Search(全文検索)
項目 | 内容 |
仕組み | キーワードマッチング |
強み | 固有名詞、型番などの正確な検索 |
弱み | 意味的な類似は検索できない |
3. Hybrid Search(ハイブリッド検索)
項目 | 内容 |
仕組み | ベクトル検索と全文検索の組み合わせ |
強み | 両方のメリットを活かせる |
推奨 | デジタルヒューマンではこちらを推奨 |
検索設定項目
TopK
検索結果として返すチャンク数:
設定値 | 用途 |
3〜5 | シンプルな質問応答 |
5〜8 | 一般的な用途(推奨) |
10以上 | 広範な情報収集 |
Score Threshold
検索結果の最低スコア閾値:
設定値 | 効果 |
0.5〜0.6 | 綾め、関連情報を広く取得 |
0.7〜0.8 | バランス型(推奨) |
0.8以上 | 厳しめ、高関連のみ |
Rerankモデル
Rerankとは
検索結果をAIモデルで再順位付けし、精度を向上させる機能です。
主なRerankモデル
モデル | 提供元 | 特徴 |
rerank-multilingual-v3.0 | Cohere | 多言語対応、推奨 |
bge-reranker-v2-m3 | BAAI | オープンソース |
rerank-english-v2.0 | Cohere | 英語特化 |
Rerankの設定
- ナレッジベースの検索設定を開く
- 「Rerankモデル」を有効化
- 使用するモデルを選択
デジタルヒューマン向け推奨設定
検索方法: Hybrid Search
TopK: 5〜6
Score Threshold: 0.7
Rerank: 有効(rerank-multilingual-v3.0)設定の理由
設定 | 理由 |
Hybrid Search | 意味検索とキーワード検索の両立 |
TopK 5〜6 | 十分な情報量とノイズ排除のバランス |
Rerank有効 | 検索精度の大幅向上 |
検索設定のチューニング
回答が見つからない場合
- TopKを増やす
- Score Thresholdを下げる
- ドキュメントの内容を確認
無関係な情報が混ざる場合
- Score Thresholdを上げる
- TopKを減らす
- Rerankを有効化
参考URL
お役に立ちましたか?
😞
😐
🤩
最終更新日 December 23, 2025