埋め込みモデルの選択
ナレッジベースで使用する埋め込みモデルの選び方を解説します。
埋め込みモデルとは
埋め込みモデル(Embedding Model)は、テキストを数値ベクトルに変換するモデルです。これにより意味的な類似度検索が可能になります。
埋め込みの仕組み
[テキスト]
↓ 埋め込みモデル
[数値ベクトル] 例: [0.123, -0.456, 0.789, ...]
↓
[ベクトルDBに保存]
↓
[類似度検索が可能に]主な埋め込みモデル
OpenAIのモデル
モデル | 次元数 | 特徴 |
text-embedding-3-large | 3072 | 最高精度、推奨 |
text-embedding-3-small | 1536 | コスト重視 |
text-embedding-ada-002 | 1536 | 旧モデル |
その他のモデル
モデル | 提供元 | 特徴 |
bge-m3 | BAAI | 多言語対応、日本語に強い |
bge-large-en | BAAI | 英語特化、高精度 |
multilingual-e5-large | Microsoft | 多言語対応 |
選択のポイント
1. 言語対応
コンテンツ | 推奨モデル |
日本語主体 | bge-m3, text-embedding-3-large |
英語主体 | text-embedding-3-large, bge-large-en |
多言語混在 | text-embedding-3-large, bge-m3 |
2. 精度とコスト
優先事項 | 推奨モデル |
精度優先 | text-embedding-3-large |
コスト優先 | text-embedding-3-small |
バランス | text-embedding-3-large |
3. デジタルヒューマン向け推奨
第1候補: text-embedding-3-large
- 理由: 高精度、日本語対応良好
第2候補: bge-m3
- 理由: 日本語に強い、オープンソース埋め込みモデルの設定
設定手順
- ナレッジベース作成時に埋め込みモデルを選択
- またはドキュメント追加時に選択
注意事項
- 一度設定した埋め込みモデルは後から変更不可
- 変更する場合はナレッジベースの再作成が必要
- 同じアプリ内で異なる埋め込みモデルのナレッジを混在可能
コストの考慮
OpenAI埋め込みモデルの料金
モデル | 料金(概算) |
text-embedding-3-large | $0.00013 / 1Kトークン |
text-embedding-3-small | $0.00002 / 1Kトークン |
コスト最適化のポイント
- 初期構築時: 全ドキュメントの埋め込みが発生
- 更新時: 変更ドキュメントのみ再埋め込み
- 検索時: クエリの埋め込みが発生
お役に立ちましたか?
😞
😐
🤩
最終更新日 December 23, 2025