検索設定(リトリーバル設定)

ナレッジベースの検索方法と各設定項目について解説します。

検索方法の種類

Difyでは3つの検索方法を選択できます:

1. Vector Search(ベクトル検索)

項目
内容
仕組み
埋め込みベクトルの類似度計算
強み
意味的に似た内容を検索
弱み
キーワード完全一致は苦手

2. Full-Text Search(全文検索)

項目
内容
仕組み
キーワードマッチング
強み
固有名詞、型番などの正確な検索
弱み
意味的な類似は検索できない

3. Hybrid Search(ハイブリッド検索)

項目
内容
仕組み
ベクトル検索と全文検索の組み合わせ
強み
両方のメリットを活かせる
推奨
デジタルヒューマンではこちらを推奨

検索設定項目

TopK

検索結果として返すチャンク数:

設定値
用途
3〜5
シンプルな質問応答
5〜8
一般的な用途(推奨
10以上
広範な情報収集

Score Threshold

検索結果の最低スコア閾値:

設定値
効果
0.5〜0.6
綾め、関連情報を広く取得
0.7〜0.8
バランス型(推奨
0.8以上
厳しめ、高関連のみ

Rerankモデル

Rerankとは

検索結果をAIモデルで再順位付けし、精度を向上させる機能です。

主なRerankモデル

モデル
提供元
特徴
rerank-multilingual-v3.0
Cohere
多言語対応、推奨
bge-reranker-v2-m3
BAAI
オープンソース
rerank-english-v2.0
Cohere
英語特化

Rerankの設定

  1. ナレッジベースの検索設定を開く
  1. 「Rerankモデル」を有効化
  1. 使用するモデルを選択

デジタルヒューマン向け推奨設定

検索方法: Hybrid Search
TopK: 5〜6
Score Threshold: 0.7
Rerank: 有効(rerank-multilingual-v3.0)

設定の理由

設定
理由
Hybrid Search
意味検索とキーワード検索の両立
TopK 5〜6
十分な情報量とノイズ排除のバランス
Rerank有効
検索精度の大幅向上

検索設定のチューニング

回答が見つからない場合

  1. TopKを増やす
  1. Score Thresholdを下げる
  1. ドキュメントの内容を確認

無関係な情報が混ざる場合

  1. Score Thresholdを上げる
  1. TopKを減らす
  1. Rerankを有効化

参考URL

お役に立ちましたか?
😞
😐
🤩

最終更新日 December 23, 2025