知識パイプラインから作成する
dify-docs-create-from-knowledge-pipeline
知識パイプライン(Knowledge Pipeline)は、ドキュメントの取り込み → 抽出 → 分割/整形 → ナレッジベース登録 までの一連の処理を、ノードをつないでビジュアルにカスタマイズできる機能です。 従来の簡易的なナレッジベース作成よりも細かな制御が可能で、複雑な前処理や構造化データへの対応に適しています。
情報の最新性と正確性について UIの文言やテンプレート名はDifyのバージョン更新により変更されている可能性があります。利用時は実際の画面と照らし合わせてご確認ください。
アクセス方法
Difyの管理画面より、以下の手順でアクセスします。
- メニューから [ナレッジ (Knowledge)] を選択
- [知識パイプラインから作成する] ボタンをクリック
テンプレートの種類

1. 空白のナレッジパイプライン
- 用途: 特殊なデータ処理が必要な場合や、独自のエキスパートフローを構築したい場合に適しています。
- 概要: データ処理と構造を完全に制御できるカスタムパイプラインをゼロから作成します。
2. 一般文書処理(汎用)
- 概要: ドキュメントを汎用的な段落ブロックに分割し、経済的なインデックス設定を採用します。
- 用途: 大量のドキュメントを高速かつ低コストで処理したい場合に適しています。
3. 長文書処理(親子)
- 概要: 親子階層型のチャンキング(Parent-Child Chunking)戦略を採用します。
- 特徴: 具体的な情報箇所を特定しつつ、その上位(親)コンテキストも保持するため、情報の欠落を防ぎます。
- 用途: 技術文書、契約書、研究レポートなどの長文資料。
4. Q&A表データ抽出(Q&A)
- 概要: 表形式のデータから指定列を抽出し、構造化された質問/回答(Q&A)ペアを生成します。
- 用途: ExcelやCSVのデータを、自然言語検索に適した形式に変換する場合。
5. 文書形式変換(Markdown)
- 概要: DOCX / XLSX / PPTX などのOffice形式ファイルをMarkdownテキストに変換します。
- メリット: LLMが理解しやすい形式に統一することで、処理効率と互換性を向上させます。
6. インテリジェントQ&A生成
- 概要: ドキュメントから重要な情報を自動的に抽出し、質問と回答のペアを生成します。
- 用途: 長文のドキュメントを、検索しやすい「知識ポイント」単位に分解・整理する場合。
パイプライン編集画面の構成
テンプレートを選択すると編集画面が開きます。この画面では、各処理を担う「ノード」を組み合わせてフローを構築します。


主なノード
- データソース (Data Source)
- パイプラインの開始点です。ドキュメントのインポート元(ファイルアップロード、Webスクレイピング等)を設定します。
- エクストラクター (Extractor)
- ドキュメントからテキストやメタデータを抽出します。
- クリーナー / 分割 (Clean / Split)
- 不要な文字の削除や、トークン数・区切り文字に基づくチャンク分割を行います。
- 知識ベース (Knowledge Base)
- パイプラインの終了点です。インデックス方式(ベクトル検索、キーワード検索等)や格納先を設定します。
チャンク構造の選択
Difyナレッジベースでは、主に以下のチャンク構造がサポートされています。
- 汎用: 標準的なチャンク分割で、文脈の連続性をある程度維持します。
- 親子: 詳細な「子チャンク」と、子チャンクを含む「親チャンク」を関連付けた階層構造を持ち、検索精度を向上させます。
- Q&A: ユーザーの想定質問と回答のペア形式。FAQ的な検索に最適です。
主な操作ボタン
- テストラン: 公開前にパイプラインを試行し、出力結果を確認します。
- 公開する: パイプラインを有効化し、実際のドキュメント処理を開始します。
- DSLファイルからインポート: 外部で作成・保存したパイプライン設定ファイル(DSL)を読み込みます。
参考URL
Dify 公式ドキュメント (Knowledge): https://docs.dify.ai/ja/use-dify/knowledge
最新の仕様については上記公式ドキュメントの「Knowledge」セクションをご確認ください。
お役に立ちましたか?
😞
😐
🤩
最終更新日 February 20, 2026