このページは、こんな方のために
エンタープライズ RAG が社内文書を毎日数千件インデックス化していませんか。取り込みの瞬間に、原本との同一性・発行者の署名・改訂履歴は失われていませんか。
AI が回答に引用したその一文が、いまも社内で有効な版の原本に由来するか──インデックス化された後の文書チャンクから、それを暗号的に遡れる経路を持っていますか。
- エンタープライズ RAG / ナレッジ管理プラットフォームの責任者、アーキテクト
- 社内文書 (規程・契約書・SOP・技術仕様書) を日々取り込んでいる AI プロダクトオーナー
- 規制業界 (金融・医療・法務) で、AI が参照する文書の真正性を求められているコンプライアンス責任者
- 「古い版を引用してしまう」「改訂前の規程が回答に出る」を運用課題として抱えているチーム
- DLP・既存ナレッジ管理基盤は導入済みだが、取り込み後の文書チャンクの来歴を固定したい技術リード
Lemma のアプローチ
Lemma は、社内文書を RAG パイプラインに取り込む瞬間に、AES-GCM で原本を暗号化したうえで、docHash・コンテンツ識別子 (CID)・発行者署名・有効バージョン情報をインデックス側に刻みます。AI が検索でヒットさせるのは原本そのものではなく、来歴を持つ事実のみです。
回答に引用された一文は、インデックスに刻まれた docHash 経由で原本のどのバージョンに由来するかが暗号的に追跡可能になります。改訂された場合は新しい docHash と発行者署名が紐付き、古いバージョンの引用は構造的に検知できます。AI が触れるのは、検証可能な来歴を持つ事実のみ。
御社の RAG インジェストパイプラインのどこに来歴レイヤを差し込めるか、まず会話で確認できます。
Lemma Discovery Call — まずは30分、会話から
いま運用している RAG パイプライン、どの文書群がどう取り込まれているか、引用の正確性で一番気になっているケース──御社の構造を聞かせてください。Lemma の来歴レイヤがフィットするかを、最初の会話で一緒に確認します。文書原本やインデックス内部の開示は必要ありません。
フィットが見えた段階で、NDA 締結のうえ、業種別の文書クラス設計・参照アーキテクチャ・PoC 設計に進みます。
実例:旧版規程を引用する社内 AI
金融機関の社内 AI が、顧客対応 SOP・コンプライアンス規程・商品仕様書・契約テンプレートを RAG で検索し、現場担当者の質問に答えています。規程は数ヶ月ごとに改訂され、各部門が独自のフォーマットで管理。改訂のたびに RAG インデックスは再構築されますが、過去版の文書チャンクが完全に置き換わったか、新版の引用が古い前提に紛れ込んでいないかを、運用上検証するのは困難です。
ある日、現場担当者が AI 回答を根拠に顧客対応をして、後で「その規程は 3 ヶ月前に改訂されています」と監査からの指摘が入ります。AI が引用した文書チャンクが、どの版の原本に由来するか──ログを横断してもインデックスのスナップショットを掘り起こす作業になります。引用の真正性を暗号的に保証する経路がありません。
Lemma が導入されていれば、各文書チャンクには取り込み時の docHash と発行者署名、有効バージョン情報が刻まれます。AI 回答に引用されたチャンクは、回答時点で有効な版に由来するかが暗号的に検証可能。改訂時には新しい docHash が付与され、古い版の引用は構造的に検知できます。監査時、AI 回答と当時の文書バージョンの対応関係は、再構築なしで提示できます。
業種別の文書クラス設計、既存ナレッジ管理基盤 (Confluence・Notion・Box・SharePoint 等) との統合パターン、規制対応 (金融庁・FINRA・医療プライバシー) は、相談コール後にお渡しする業種別キットでご共有しています。
アーキテクチャ概念
Lemma は既存の RAG パイプライン (ベクトル DB・埋め込みモデル・検索層) を置き換えません。インジェストと取得の経路に、来歴レイヤを 1 段挟むだけです。
原本は AES-GCM で暗号化され、ベクトル DB と検索インデックスには docHash・CID・発行者署名・有効バージョン情報だけが入ります。検索ヒットされたチャンクは、回答生成時に来歴情報と共に出力されるため、引用の真正性が暗号的に追跡可能です。文書改訂時の差し替えは新 docHash の発行で扱われ、旧版チャンクの参照は構造的に検知できます。
既存ベクトル DB (Pinecone・Weaviate・Qdrant 等)、検索フレームワーク (LangChain・LlamaIndex 等)、ナレッジ管理基盤との統合パターンは、ホワイトペーパーおよび相談コール後の技術資料で詳述しています。
Lemma が暗号的に保証する事実
- 各文書チャンクの取り込み時刻・発行者署名・docHash と CID
- 原本との同一性および AES-GCM 暗号化下での原本非開示性
- 改訂時の新 docHash 発行と、旧版チャンク参照の構造的検知
- AI 回答に含まれる引用と原本バージョンの暗号的紐付け、および第三者検証可能性
証明する準備はできましたか?
ユースケースについてお聞かせください。1営業日以内にご返信いたします。