Karpathy 流 LLM Wiki で社内知識を漏らさない ─ 受託で設計する組織 RAG 2026

2026 年 5 月 25 日、Zenn に社内の知見を AI が漏らさず拾う唯一の設計思想 ─ Karpathy 氏の LLM Wiki を実践して分かったことが公開されました。記事は Andrej Karpathy 氏が提唱する「LLM Wiki」の設計思想（1 トピック 1 ファイル / 自己完結 / リンクで関係性表現 / LLM が読み下しやすい平易な記述）を、実プロジェクトで実践し検証したものです。結論は 「Notion / Confluence の階層構造は LLM 取り出しに不向き / フラット + 高密度の Wiki が組織 RAG の品質を決める」でした。Stack Overflow の Q&A 利用が衰退し (Stack Overflow 衰退 → 社内ナレッジ Q&A 置換受託参照)、社内の暗黙知 / 設計判断 / ポストモーテムが AI で再利用可能な形で残るかが、組織の生産性を左右する時代になりました。

受託で中堅企業の 社内知識基盤 / 組織 RAGを設計する立場では、これは 「Notion を大量に書いても AI が拾わない」という典型課題に、Karpathy 型 LLM Wiki 設計 + 組織 RAG パイプライン + 運用文化醸成を一体で実装する受託機会を意味します。これまでプライベート MCP サーバ実装受託で扱った 社内 MCP 基盤、マルチモーダル Embedding + Reranker エンタープライズ RAG 受託で扱った RAG 検索品質、Cloudflare エージェントメモリ業務システム受託で扱った エージェントメモリを 「上流のナレッジ構造そのもの」から設計し直す受託テーマです。

なぜ「LLM Wiki 設計が分水嶺」なのか

観点	既存 Notion / Confluence	Karpathy 型 LLM Wiki
構造	階層 / ツリー	フラット + 双方向リンク
粒度	数千字の長文 / 大ページ	1 トピック 1 ファイル / 短文
自己完結性	親ページに依存	各ファイル単独で読める
冗長性	重複を嫌う	必要なら重複も許す
LLM 取り出し成功率	30〜55%	70〜85%
更新文化	担当者の善意頼み	仕事の一部に組込み
検索粒度	ページ単位	チャンク単位 + 自己完結
暗黙知の表現	言外 / 図 / 雑談に分散	明示的に書き起こす

つまり LLM Wiki 設計は 「人間が読めば分かる Notion」から 「AI が拾える / 人間も読める Wiki」へ、ナレッジの一次形式を変える設計判断です。

受託案件で活きる 3 つの構造変化

構造 1: 「ナレッジは Notion に書いてあるはず」から「AI 取り出し前提の Wiki」へ

中堅企業の Notion / Confluence は 5,000〜30,000 ページ規模に膨張し、「あるはずだが見つからない」「書いてあるが古い」状態が常態化しています。LLM Wiki への 再構造化 + 移行ガイドラインを提供する受託は、「既存ナレッジ資産を AI 時代に再活用」するための入口になります。

構造 2: 「RAG はベクトル検索チューニング」から「ナレッジ構造の設計」へ

組織 RAG の品質改善は 「Embedding モデル変える / Reranker 入れる / チャンクサイズ変える」といった 検索側のチューニングで語られがちですが、Karpathy 流が示すのは 「源泉のドキュメント構造を変えるほうが効果的」という事実です。これはマルチモーダル Embedding + Reranker エンタープライズ RAG 受託や Ettin Reranker RAG 最適化受託の 下流チューニングを補完する 上流設計受託です。

構造 3: 「ナレッジマネジメントは情シス / 総務管轄」から「業務の標準動作」へ

「ドキュメントを書く文化」は 担当者の善意に頼ってきましたが、AI で再利用可能にするには **「業務完了時の Wiki 更新」を 標準動作に組み込む必要があります。これは Anthropic XML プロンプト構造受託で扱った プロンプト資産化と同じく、「個人技から組織資産へ」**の文化変容です。

「Karpathy 型 LLM Wiki + 組織 RAG」導入の 5 フェーズ

フェーズ 1: 現状診断（2〜3 週間）

既存ナレッジ棚卸し（Notion / Confluence / Slack / ファイル）
LLM 取り出し成功率測定（代表 30 クエリ）
ナレッジ更新頻度 / 著者分布
業務プロセスとナレッジの紐付け
LLM Wiki 化候補領域の優先順位付け

フェーズ 2: Wiki 設計（2〜3 週間）

LLM Wiki スキーマ定義（トピック粒度 / リンク規約）
命名規約 / メタデータ標準
移行ガイドライン（既存 Notion → LLM Wiki）
セキュリティ / アクセス制御設計
更新トリガー設計（業務完了 / PR マージ / 障害対応後）

フェーズ 3: パイロット移行（3〜4 週間）

1〜2 部署で LLM Wiki 試験運用
既存ナレッジの 100〜300 トピック移行
RAG パイプライン構築（ベクトル DB / Reranker）
検索成功率 A/B 評価
利用者ヒアリング + 改善

フェーズ 4: 全社展開（4〜8 週間）

部署別段階展開
RAG 検索 UI / Slack 統合 / IDE 統合
更新文化醸成（オンボーディング / KPI）
品質メトリクス（成功率 / 鮮度 / 重複）
ガバナンス（公開範囲 / 機密区分）

フェーズ 5: 月次運用レビュー（継続）

LLM 取り出し成功率モニタリング
古いトピック / 重複検出
新規業務領域の Wiki 化追加
RAG パイプライン進化追従
利用状況 / ユーザー満足度

受託向け技術スタック標準セット

レイヤ	推奨技術	代替
Wiki ホスト	Git + Markdown / Outline / Logseq	Notion + 規約強化
ベクトル DB	Vectorize / Qdrant / Weaviate	pgvector
Embedding	OpenAI / Cohere / Granite multilingual	E5 / BGE
Reranker	Ettin / Cohere Rerank / Voyage	Custom
RAG オーケストレーション	LlamaIndex / LangChain / Mastra	自作
検索 UI	Glean / 自作 + Slackbot	Microsoft Search
アクセス制御	OIDC + ABAC	LDAP / SAML
可観測性	Langfuse / Phoenix	Datadog

どの案件に必要か / 不要か

必要な案件	不要な案件
Notion / Confluence が 5,000 ページ超	ドキュメント 100 ページ未満
社員 50 名以上	数名規模
業務プロセスが文書依存	全業務が口頭 / 直接連携
退職 / 異動でナレッジが失われやすい	全員が長期在籍
AI 検索 / アシスタント導入を計画中	検索ニーズなし

受託契約に書く 6 つの条項

条項	内容	顧客が確認すべきこと
対象ナレッジ範囲	部署 / プロセス / 機密区分	コンプライアンス適合
Wiki スキーマ知財	スキーマ仕様 + ガイドラインの帰属	二次利用条件
検索品質 SLA	取り出し成功率 / 鮮度	業務 KPI 連動
更新文化醸成	オンボーディング / トレーニング	体制整備
アクセス制御	公開 / 機密区分の運用	法令 / 顧客契約適合
退場時引き渡し	Wiki + RAG + 評価セット	自社運用継続性

顧客側 ROI 試算（社員 200 名 / Notion 12,000 ページ / 既存 RAG 検索成功率 40% 想定）

項目	既存（Notion + RAG）	LLM Wiki 移行後	差分
LLM 取り出し成功率	40%	78%	+38pt
ナレッジ検索工数（月）	600h	220h	-380h
新人オンボーディング期間	3 ヶ月	1.5 ヶ月	-1.5 ヶ月
退職 / 異動時の知識ロス	大（属人化）	限定（Wiki に残る）	リスク低減
同じ問題の再発生件数	月 18 件	月 5 件	-13 件 / 月
年間効果	—	—	約 3,650 万円相当 + 組織レジリエンス向上

時給 8,000 円換算で 年間 3,650 万円超の工数削減 + 退職リスク低減という試算になります。投資対効果は移行対象の規模と現状の検索成功率で大きく変わるため、フェーズ 1 の現状診断で実測してから判断するのが確実です。

ハマりやすい 5 つの落とし穴

落とし穴 1: 「全 Notion を Wiki 化」で完了主義

12,000 ページを一気に移行しようとすると、疲弊して頓挫します。頻出 / 業務クリティカル領域から 300 トピック単位で段階移行します。

落とし穴 2: 階層を残したまま Wiki 化

「フラット + リンク」が原則なのに 既存階層をそのまま残すと、LLM の取り出し成功率が伸びません。スキーマ設計時に 階層撤廃 + リンク補強を徹底します。

落とし穴 3: 更新文化醸成を後回し

「ツールを入れれば書く」と思って 書く動機設計を省くと、3 ヶ月後に古いナレッジだらけになります。業務完了テンプレ + KPI 反映を初期に設計します。

落とし穴 4: アクセス制御を後付け

「全員に開放」で 機密情報が混在すると、法務 / 顧客契約で問題化します。公開 / 部内 / 限定の 3 区分を 初期スキーマに組み込みます。

落とし穴 5: RAG のチューニングだけで解決しようとする

「Reranker を入れれば成功率が上がる」と 検索側だけ強化しても、源泉が古い / 重複 / 階層依存なら限界があります。Wiki 側の設計と並走します。

90 日アクションプラン

週	アクション
Week 1〜2	ナレッジ棚卸し + 取り出し成功率測定
Week 3〜4	LLM Wiki スキーマ設計 + 移行ガイド
Week 5〜7	パイロット部署で 300 トピック移行
Week 8〜9	RAG パイプライン構築 + A/B 評価
Week 10	全社展開計画 + オンボーディング設計
Week 11	Slack / IDE 統合
Week 12〜13	月次レビュー定例化 + KPI 反映

まとめ — 「Notion に書いてあるはず」から「AI が拾える Wiki」へ

Karpathy 型 LLM Wiki は、**「ナレッジは書けば伝わる」前提を覆し、「AI 取り出しを前提に書く」**という新しいドキュメント文化を提示しました。受託で中堅企業の社内知識基盤を支える立場では、Wiki スキーマ設計 + 段階移行 + RAG 構築 + 更新文化醸成 + 月次運用を切り離さず一体で考えることが、これからの組織 RAG 設計の要になります。

「Notion はあるが AI が拾えない」「退職で知識が失われる」「RAG チューニングが頭打ち」といった課題は、既存ナレッジの規模も業務プロセスへの依存度も企業ごとに大きく異なります。Wiki スキーマ設計や段階移行の進め方については、現状の棚卸しを踏まえて個別にお見積りしますので、お問い合わせフォームからお気軽にご相談ください。

Google Workspace の2段階認証とセキュリティ設定 — 管理者が締め出される前に

自社サイトがAIエージェントに「操作される」時代へ — WebMCPで予約・購入を取りこぼさない準備

脆弱性診断とは｜種類・費用相場・ツール・依頼先の選び方を中小企業向けに解説

Karpathy 流 LLM Wiki で社内知識を漏らさない ─ 受託で設計する組織 RAG 2026

なぜ「LLM Wiki 設計が分水嶺」なのか

受託案件で活きる 3 つの構造変化