埋め込みモデルの選択

ナレッジベースで使用する埋め込みモデルの選び方を解説します。

埋め込みモデルとは

埋め込みモデル(Embedding Model)は、テキストを数値ベクトルに変換するモデルです。これにより意味的な類似度検索が可能になります。

埋め込みの仕組み

[テキスト]
    ↓ 埋め込みモデル
[数値ベクトル] 例: [0.123, -0.456, 0.789, ...]
    ↓
[ベクトルDBに保存]
    ↓
[類似度検索が可能に]

主な埋め込みモデル

OpenAIのモデル

モデル
次元数
特徴
text-embedding-3-large
3072
最高精度、推奨
text-embedding-3-small
1536
コスト重視
text-embedding-ada-002
1536
旧モデル

その他のモデル

モデル
提供元
特徴
bge-m3
BAAI
多言語対応、日本語に強い
bge-large-en
BAAI
英語特化、高精度
multilingual-e5-large
Microsoft
多言語対応

選択のポイント

1. 言語対応

コンテンツ
推奨モデル
日本語主体
bge-m3, text-embedding-3-large
英語主体
text-embedding-3-large, bge-large-en
多言語混在
text-embedding-3-large, bge-m3

2. 精度とコスト

優先事項
推奨モデル
精度優先
text-embedding-3-large
コスト優先
text-embedding-3-small
バランス
text-embedding-3-large

3. デジタルヒューマン向け推奨

第1候補: text-embedding-3-large
  - 理由: 高精度、日本語対応良好

第2候補: bge-m3
  - 理由: 日本語に強い、オープンソース

埋め込みモデルの設定

設定手順

  1. ナレッジベース作成時に埋め込みモデルを選択
  1. またはドキュメント追加時に選択

注意事項

  • 一度設定した埋め込みモデルは後から変更不可
  • 変更する場合はナレッジベースの再作成が必要
  • 同じアプリ内で異なる埋め込みモデルのナレッジを混在可能

コストの考慮

OpenAI埋め込みモデルの料金

モデル
料金(概算)
text-embedding-3-large
$0.00013 / 1Kトークン
text-embedding-3-small
$0.00002 / 1Kトークン

コスト最適化のポイント

  1. 初期構築時: 全ドキュメントの埋め込みが発生
  1. 更新時: 変更ドキュメントのみ再埋め込み
  1. 検索時: クエリの埋め込みが発生
お役に立ちましたか?
😞
😐
🤩

最終更新日 December 23, 2025