RAGの「 辞書 」を整えよう!AIが迷わないための資料作成のコツ

平素より弊社サービスをご利用いただきまして、ありがとうございます。
[ カスタマーサクセス部 ]の小川です。
前回、前々回と、RAG(検索拡張生成)システムを使いこなすための「 プロンプト 」の重要性について
お話ししてきました。また、AIを「 ポテンシャルのある新入社員 」に例え、RGCやCoTといった具体的な
指示(プロンプト)を与えることで、回答の正確性や実用性が高まることをお伝えしました。
しかし、プロンプトをどんなに磨いても、AIの回答が「 どうも的外れだ 」、「 情報が足りない 」と感じることはありませんでしょうか。
実は、AIの回答精度を左右する要素は、プロンプトだけではありません。
今回は、RAGシステムのもう一つの要である、AIが参照する「 辞書(知識の土台) 」、
つまり社内資料の整備について解説したいと思います。
■優秀な「新入社員」も、古いマニュアルでは迷ってしまう
RAGシステムは、質問に対して「 社内マニュアル(検索で得た情報) 」と
「 具体的な指示書(プロンプト) 」をセットで渡す仕組みでした。
ここで、少し想像してみてください。
あなたの会社に、非常に優秀で指示の理解力も抜群な新入社員が入ってきたとします。
しかし、彼に渡されたマニュアルが次のような状態だったらどうでしょうか。
‐ 情報が古く、現在のルールと食い違っている
‐ 一つのファイルに、全く関係のない情報がごちゃ混ぜになっている
‐ 曖昧な表現や専門用語の定義が不明確である
どんなに「 このマニュアルのこの部分だけを使って、初心者にも分かりやすいように要約して! 」と明確に
指示しても、新入社員は混乱し、結果として「 正確ではない回答 」や「 根拠の薄い回答 」を出してしまうはずです。
私は、RAGシステムも同じだと考えています。その真価を発揮させるには、プロンプトという「 指示 」だけでなく、参照元となる「 辞書 」を、AIが迷わず使えるように整える一工夫が不可欠です。
■AIが読みやすい「辞書」にするための3つのコツ
RAGシステムが参照する資料は、AIが検索し、内容を理解しやすいように構造化されている必要があります。ここでは、AIの「 読解力 」を最大限に引き出すための、資料作成のコツを3つご紹介します。
1.情報の粒度を揃える(チャンクの最適化)
RAGシステムは、資料を細かく区切った「 情報のかけら(チャンク) 」を検索してきます。
このチャンクの粒度が重要です。
悪い例:50ページにわたる「 全社規定集 」を一つのファイルとして登録する
→ AIは、質問に関係のない情報まで一緒に検索してしまい、ノイズが増える可能性があります
良い例: 「 就業規則 」、「 旅費規定 」など、一つのテーマでファイルを分ける。
→ AIは、質問に最も関連性の高い「 情報のかけら 」だけを効率よく見つけられます。
【 ポイント 】
ファイル名や見出しに、内容を具体的に示すキーワードを含めることで、
AIが検索する際の「 手がかり 」が増え、精度が向上します。
2.曖昧な表現を避ける(固有名詞と定義の明確化)
人間同士の会話では通じる「 暗黙の了解 」は、AIにとっては大きな障害となります。
悪い例:「 この商品の仕様は、前の資料に書いてある通りです。 」
良い例:「 この商品の仕様は、商品A_仕様書_Ver2.1に記載されている通りです。 」
【 ポイント 】
プロジェクト名、製品名、部署名などの固有名詞は、資料内で一貫して同じ表記を使い、
可能であれば冒頭で正式名称と略称の定義を明記しましょう。
当社で言うと、AppSuiteの略称をASと記述するイメージになります。
3.構造化を意識する(見出しと箇条書きの活用)
AIは、文書の「 構造 」を読み取るのが得意です。
例えば、見出しや箇条書きのように、情報の区切りがはっきりした形式は、AIの理解を助けます。
見出し(#、##):階層構造を明確にし、情報の重要度をAIに伝えます。
箇条書き(リスト):複数の要素を整理して提示することで、AIが情報を抽出・分類しやすくなります。
【 ポイント 】
長文で説明するよりも、箇条書きで「 メリット 」、「 デメリット 」、「 手順 」などを整理するだけで、
AIは「 この情報はリスト化された重要な要素だ 」と認識し、回答に反映しやすくなります。
■プロンプトと「 辞書 」の両輪で、AIを「 最高で最強の相棒 」に!
繰り返しにはなりますが、RAGシステムは、プロンプトという「 具体的な指示 」と、社内資料という
「 信頼できる辞書 」が揃ってはじめて、その真価を発揮します。
プロンプトを磨くことは、AIの「 思考プロセス 」を整えること。 資料を整えることは、AIの「 知識の土台 」
を強固にすることに繋がります。
この両輪を意識した一工夫が、皆さまの業務効率化、生産性向上を後押しすることを願っています。
次回からは、当社からご提案可能なRAGシステムである、neoAI Chatをご紹介いたします。
では、またお会いしましょう!
■お問い合わせ先
株式会社 ネオジャパン カスタマーサクセス部
E-mail:csuccess@desknets.com
■前回、前々回の記事もチェックください!
▼RAGシステムで成果を出すコツは「 プロンプト 」にあり!
https://www.desknets.com/neo/users/media/solution/16179/
▼そのプロンプト、大丈夫?AIに入力してはいけない情報と、安全な活用の「鍵」
https://www.desknets.com/neo/users/media/popular/16223/