Karpathy 流 LLM Wiki で社内知識を漏らさない ─ 受託で設計する組織 RAG 2026 | GH Media
URLがコピーされました

Karpathy 流 LLM Wiki で社内知識を漏らさない ─ 受託で設計する組織 RAG 2026

URLがコピーされました
Karpathy 流 LLM Wiki で社内知識を漏らさない ─ 受託で設計する組織 RAG 2026

2026 年 5 月 25 日、Zenn に 社内の知見を AI が漏らさず拾う唯一の設計思想 ─ Karpathy 氏の LLM Wiki を実践して分かったこと が公開されました。記事は Andrej Karpathy 氏が提唱する「LLM Wiki」の設計思想(1 トピック 1 ファイル / 自己完結 / リンクで関係性表現 / LLM が読み下しやすい平易な記述)を、実プロジェクトで実践し検証したものです。結論は 「Notion / Confluence の階層構造は LLM 取り出しに不向き / フラット + 高密度の Wiki が組織 RAG の品質を決める」でした。Stack Overflow の Q&A 利用が衰退し (Stack Overflow 衰退 → 社内ナレッジ Q&A 置換受託 参照)、社内の暗黙知 / 設計判断 / ポストモーテムAI で再利用可能な形で残るかが、組織の生産性を左右する時代になりました。

受託で中堅企業の 社内知識基盤 / 組織 RAGを設計する立場では、これは 「Notion を大量に書いても AI が拾わない」という典型課題に、Karpathy 型 LLM Wiki 設計 + 組織 RAG パイプライン + 運用文化醸成を一体で実装する受託機会を意味します。これまで プライベート MCP サーバ実装受託 で扱った 社内 MCP 基盤マルチモーダル Embedding + Reranker エンタープライズ RAG 受託 で扱った RAG 検索品質Cloudflare エージェントメモリ業務システム受託 で扱った エージェントメモリ「上流のナレッジ構造そのもの」から設計し直す受託テーマです。

なぜ「LLM Wiki 設計が分水嶺」なのか

観点既存 Notion / ConfluenceKarpathy 型 LLM Wiki
構造階層 / ツリーフラット + 双方向リンク
粒度数千字の長文 / 大ページ1 トピック 1 ファイル / 短文
自己完結性親ページに依存各ファイル単独で読める
冗長性重複を嫌う必要なら重複も許す
LLM 取り出し成功率30〜55%70〜85%
更新文化担当者の善意頼み仕事の一部に組込み
検索粒度ページ単位チャンク単位 + 自己完結
暗黙知の表現言外 / 図 / 雑談に分散明示的に書き起こす

つまり LLM Wiki 設計は 「人間が読めば分かる Notion」から 「AI が拾える / 人間も読める Wiki」へ、ナレッジの一次形式を変える設計判断です。

受託案件で活きる 3 つの構造変化

構造 1: 「ナレッジは Notion に書いてあるはず」から「AI 取り出し前提の Wiki」へ

中堅企業の Notion / Confluence は 5,000〜30,000 ページ規模に膨張し、「あるはずだが見つからない」書いてあるが古い」状態が常態化しています。LLM Wiki への 再構造化 + 移行ガイドラインを提供する受託は、「既存ナレッジ資産を AI 時代に再活用」するための入口になります。

構造 2: 「RAG はベクトル検索チューニング」から「ナレッジ構造の設計」へ

組織 RAG の品質改善は 「Embedding モデル変える / Reranker 入れる / チャンクサイズ変える」といった 検索側のチューニングで語られがちですが、Karpathy 流が示すのは 「源泉のドキュメント構造を変えるほうが効果的」という事実です。これは マルチモーダル Embedding + Reranker エンタープライズ RAG 受託Ettin Reranker RAG 最適化受託下流チューニングを補完する 上流設計受託です。

構造 3: 「ナレッジマネジメントは情シス / 総務管轄」から「業務の標準動作」へ

「ドキュメントを書く文化」は 担当者の善意に頼ってきましたが、AI で再利用可能にするには **「業務完了時の Wiki 更新」標準動作に組み込む必要があります。これは Anthropic XML プロンプト構造受託 で扱った プロンプト資産化と同じく、「個人技から組織資産へ」**の文化変容です。

受託で提供する「Karpathy 型 LLM Wiki + 組織 RAG」5 フェーズ

フェーズ 1: 現状診断(2〜3 週間)

  • 既存ナレッジ棚卸し(Notion / Confluence / Slack / ファイル)
  • LLM 取り出し成功率測定(代表 30 クエリ)
  • ナレッジ更新頻度 / 著者分布
  • 業務プロセスとナレッジの紐付け
  • LLM Wiki 化候補領域の優先順位付け

フェーズ 2: Wiki 設計(2〜3 週間)

  • LLM Wiki スキーマ定義(トピック粒度 / リンク規約)
  • 命名規約 / メタデータ標準
  • 移行ガイドライン(既存 Notion → LLM Wiki)
  • セキュリティ / アクセス制御設計
  • 更新トリガー設計(業務完了 / PR マージ / 障害対応後)

フェーズ 3: パイロット移行(3〜4 週間)

  • 1〜2 部署で LLM Wiki 試験運用
  • 既存ナレッジの 100〜300 トピック移行
  • RAG パイプライン構築(ベクトル DB / Reranker)
  • 検索成功率 A/B 評価
  • 利用者ヒアリング + 改善

フェーズ 4: 全社展開(4〜8 週間)

  • 部署別段階展開
  • RAG 検索 UI / Slack 統合 / IDE 統合
  • 更新文化醸成(オンボーディング / KPI)
  • 品質メトリクス(成功率 / 鮮度 / 重複)
  • ガバナンス(公開範囲 / 機密区分)

フェーズ 5: 月次運用レビュー(継続)

  • LLM 取り出し成功率モニタリング
  • 古いトピック / 重複検出
  • 新規業務領域の Wiki 化追加
  • RAG パイプライン進化追従
  • 利用状況 / ユーザー満足度

受託向け技術スタック標準セット

レイヤ推奨技術代替
Wiki ホストGit + Markdown / Outline / LogseqNotion + 規約強化
ベクトル DBVectorize / Qdrant / Weaviatepgvector
EmbeddingOpenAI / Cohere / Granite multilingualE5 / BGE
RerankerEttin / Cohere Rerank / VoyageCustom
RAG オーケストレーションLlamaIndex / LangChain / Mastra自作
検索 UIGlean / 自作 + SlackbotMicrosoft Search
アクセス制御OIDC + ABACLDAP / SAML
可観測性Langfuse / PhoenixDatadog

どの案件に必要か / 不要か

必要な案件不要な案件
Notion / Confluence が 5,000 ページ超ドキュメント 100 ページ未満
社員 50 名以上数名規模
業務プロセスが文書依存全業務が口頭 / 直接連携
退職 / 異動でナレッジが失われやすい全員が長期在籍
AI 検索 / アシスタント導入を計画中検索ニーズなし

受託契約に書く 6 つの条項

条項内容顧客が確認すべきこと
対象ナレッジ範囲部署 / プロセス / 機密区分コンプライアンス適合
Wiki スキーマ知財スキーマ仕様 + ガイドラインの帰属二次利用条件
検索品質 SLA取り出し成功率 / 鮮度業務 KPI 連動
更新文化醸成オンボーディング / トレーニング体制整備
アクセス制御公開 / 機密区分の運用法令 / 顧客契約適合
退場時引き渡しWiki + RAG + 評価セット自社運用継続性

価格モデル — Karpathy 型 LLM Wiki + 組織 RAG パッケージ

プラン金額対象内容
診断 / PoC180 万円〜(6 週間)棚卸し + 1 部署パイロットレポート + ロードマップ
Lite60 万円〜 / 月社員 50〜150 名月次レビュー + 改善
Standard130 万円〜 / 月社員 150〜400 名+ 更新文化醸成 + ガバナンス
Enterprise260 万円〜 / 月社員 400 超 / 全社展開+ 専任ナレッジエンジニア
初期構築460 万円〜(一括)Wiki + RAG + 検索 UI 構築全プラン共通オプション

顧客側 ROI 試算(社員 200 名 / Notion 12,000 ページ / 既存 RAG 検索成功率 40% 想定)

項目既存(Notion + RAG)LLM Wiki 移行後差分
LLM 取り出し成功率40%78%+38pt
ナレッジ検索工数(月)600h220h-380h
新人オンボーディング期間3 ヶ月1.5 ヶ月-1.5 ヶ月
退職 / 異動時の知識ロス大(属人化)限定(Wiki に残る)リスク低減
同じ問題の再発生件数月 18 件月 5 件-13 件 / 月
年間効果約 3,650 万円相当 + 組織レジリエンス向上

時給 8,000 円換算で 年間 3,650 万円超の工数削減 + 退職リスク低減。Standard プラン(年額 1,560 万円)でも 6 ヶ月以内で回収可能です。

ハマりやすい 5 つの落とし穴

落とし穴 1: 「全 Notion を Wiki 化」で完了主義

12,000 ページを一気に移行しようとすると、疲弊して頓挫します。頻出 / 業務クリティカル領域から 300 トピック単位で段階移行します。

落とし穴 2: 階層を残したまま Wiki 化

「フラット + リンク」が原則なのに 既存階層をそのまま残すと、LLM の取り出し成功率が伸びません。スキーマ設計時に 階層撤廃 + リンク補強を徹底します。

落とし穴 3: 更新文化醸成を後回し

「ツールを入れれば書く」と思って 書く動機設計を省くと、3 ヶ月後に古いナレッジだらけになります。業務完了テンプレ + KPI 反映を初期に設計します。

落とし穴 4: アクセス制御を後付け

「全員に開放」で 機密情報が混在すると、法務 / 顧客契約で問題化します。公開 / 部内 / 限定の 3 区分を 初期スキーマに組み込みます。

落とし穴 5: RAG のチューニングだけで解決しようとする

「Reranker を入れれば成功率が上がる」と 検索側だけ強化しても、源泉が古い / 重複 / 階層依存なら限界があります。Wiki 側の設計と並走します。

90 日アクションプラン

アクション
Week 1〜2ナレッジ棚卸し + 取り出し成功率測定
Week 3〜4LLM Wiki スキーマ設計 + 移行ガイド
Week 5〜7パイロット部署で 300 トピック移行
Week 8〜9RAG パイプライン構築 + A/B 評価
Week 10全社展開計画 + オンボーディング設計
Week 11Slack / IDE 統合
Week 12〜13月次レビュー定例化 + KPI 反映

まとめ — 「Notion に書いてあるはず」から「AI が拾える Wiki」へ

Karpathy 型 LLM Wiki は、**「ナレッジは書けば伝わる」前提を覆し、「AI 取り出しを前提に書く」**という新しいドキュメント文化を提示しました。受託で中堅企業の社内知識基盤を支える立場では、Wiki スキーマ設計 + 段階移行 + RAG 構築 + 更新文化醸成 + 月次運用を一体で提供する 「Karpathy 型 LLM Wiki + 組織 RAG」が、新しい主力サービスになります。

弊社では 診断 / Lite / Standard / Enterprise の 4 段階で本パッケージを提供しています。「Notion はあるが AI が拾えない」「退職で知識が失われる」「RAG チューニングが頭打ち」というご相談は お問い合わせフォーム からお気軽にどうぞ。

Sources

URLがコピーされました

グリームハブ株式会社は、変化の激しい時代において、アイデアを形にし、人がもっと自由に、もっと創造的に生きられる世界を目指しています。

記事を書いた人

鈴木 翔

鈴木 翔

技術の可能性に魅了され、学生時代からプログラミングとデジタルアートの分野に深い関心を持つ

関連記事