RAG コンテンツ来歴
Hide ── 隠す 文書原本・全文
Prove ── 証明する AI が参照した版が正規発行物である
RAG 取り込み時に文書の来歴を docHash と発行者署名として固定。AI 引用の真正性が暗号的に追跡可能になります。
live in production since 2025 · 公共インフラ PoC 稼働中 · ETHGlobal AI Agents 2026 Finalist
01 · 課題認識
推進担当の、3 つの声。
- 情シス・業務 DX
「RAG に取り込む文書の来歴を、取り込み時点で固定する仕組みが要る」
- ガバナンス
「文書が改ざんされていないこと、誰が発行したかを後から検証したい」
- AI 開発担当
「文書のバージョン管理と、改ざん検知を一体で運用したい」
02 · 変化
原本を渡すか、事実だけを渡すか。
AI に渡すものが変われば、漏洩のリスクごと消える。
Without Lemma
原本をそのまま渡す
- doc_path:
- /shared/就業規則.pdf
- uploaded_by:
- user-123
- content:
- 本文…
- version:
- 未管理
- signed:
- なし
↓ すべて AI・外部へ渡る
With Lemma
事実だけを渡す
- subject:
- did:lemma:doc-policy-v3
- issuer:
- did:lemma:docs.internal
- sourceHash:
- 0x4f8a…
- lineageChain:
- [upload, index, embed]
- integrity:
- poseidon-merkle
- ZK verified:
- ✓ VALID
↓ 必要な事実だけ AI へ渡る
社内文書を RAG に取り込む瞬間に、原本を暗号化したうえで、文書の指紋(sourceHash)・発行者署名・有効バージョンをインデックス側に刻みます。AI が検索でヒットさせるのは原本そのものではなく、来歴を持つ事実だけ。引用された一文は、刻まれた指紋経由でどの版に由来するかを追跡でき、改訂されれば古い版の引用は構造的に検知できます。
技術詳細を見る ↗03 · 選定基準
3 つの基準で、選ぶ。
「中身を出さず渡す」「独立検証」「改ざん不能」の3 つが同時に要る業務こそが Lemma の領域です。
| 手段 | 中身を出さず渡す | 独立検証 | 改ざん不能 |
|---|---|---|---|
| アクセス制御のみ | △ | ✗ | ✗ |
| マスキング / 匿名化 | △ | ✗ | ✗ |
| 暗号化のみ | ✓ | ✗ | ✗ |
| Lemma(ZK 証明)唯一 3 つ揃う | ✓ | ✓ | ✓ |
04 · 進め方
進め方
RAG パイプラインの来歴設計と PoC から入り、運用まで伴走します。
- 30分の棚卸し — AI に取り込んでいる文書群のうち、引用の真正性が一番気になる経路を特定。
- 証明したい判定(結果)を1〜2個に絞る — 例:「この引用は有効版に由来する」「旧版チャンクではない」など、AI 回答が依拠する事実。原本は出しません。
- 接続と版固定を設計 — 既存 RAG インジェスト/取得パイプラインへの来歴レイヤの差し込み方式と、参照元の版固定。
- PoC(見積ベース)で1経路を実証 — 1つの文書クラスで来歴が追跡できることを確認。
- 導入支援と運用の伴走へ — 導入から運用まで継続して伴走します。費用感の目安として既存プラン区分(Civic / Critical / Compliance)を参照しますが、構成と価格は会話のなかで設計します。
「インデックス化されたが、引用が信頼できるか分からない」を抱える文書経路を1つ、最初の30分で聞かせてください。文書原本やインデックス内部の開示は必要ありません。
より広い活用シーン
このユースケースを含む、活用シーンの全体像。
業界・業務領域ごとの活用シーンと、4 つの軸で整理しています。
Solutions で 来歴証明の活用シーンを見る →DISCOVERY CALL
まずは、30 分の対話から。
Lemma の機能や活用場面について、ご質問にお答えします。技術的な詳細や機微情報(個人情報や機密情報など)の開示は不要です。