📚
FAQ・社内ナレッジ検索でも重要なのは「データ構造」
最近は、
- FAQ
- 社内ナレッジ
- マニュアル検索
などを、
AIで検索したいという相談もかなり増えています。
ただ実際は、
「資料を入れれば動く」
わけではありません。
例えば、
- PDFをそのまま投入
- PPTをそのままRAG化
- 長文マニュアルを丸ごと登録
などをすると、
かなりズレた回答になることがあります。
実際、
私も最初は:
- スライド単位で分断
- 文脈不足
- 人間向け資料
などが原因で、
かなり精度が不安定になりました。
そのため最近は、
「AIに合わせてデータを設計する」
ことをかなり重視しています。
例えば:
- Chunkサイズ
- 文脈維持
- JSON構造化
- タグ分離
- FAQ化
などです。
特に、
「人間に分かりやすい」
と、
「AIに分かりやすい」
はかなり違います。
最近は、
Dify × RAG × Spreadsheet を組み合わせながら、
実務向けの構成を色々試しています。