2026 年 5 月 29 日、InfoQ が GitHub Slashes Agent Workflow Token Spend up to 62% with Daily Audits and MCP Pruning を公開しました。GitHub 社内で エージェント Workflow が呼び出す MCP ツール群を日次で監査し、使われていないツールを自動でプルーニングした結果、トークン消費を最大 62% 削減できた事例です。注目点は単純な「キャッシュ強化」ではなく、「ツール定義そのものが膨張する → コンテキスト膨張 → コスト膨張」という構造的問題に 「日次監査 + 自動プルーニング」で正面から介入した点です。
これは GitHub エージェント Workflow トークン効率化受託 で扱った コンテキスト削減の続編にあたり、「MCP ツールの肥大化」という新しいコスト要因への対応を必要とします。受託で中堅企業の AI エージェント基盤を運用する立場では、これは **「動いているから OK」を超えて、「使われていないツールを定期的に削ぎ落とす運用文化」を組み込む転換点です。これまで GitHub Copilot 従量課金受託 で扱った 課金体系統制、既存 API を MCP サーバー化する受託 で扱った MCP 化設計と接続して、「MCP プルーニング + 日次監査 × 受託統制」**を新しい標準サービスとして整理します。
なぜ「MCP プルーニング」が分水嶺なのか
| 観点 | プルーニングなし(従来) | 日次監査 + プルーニング |
|---|---|---|
| ツール定義 | 案件開始時にまとめて登録 | 使用頻度を監査して動的削減 |
| コンテキスト送信 | 全ツール定義を毎回送信 | 直近 N 日に使われたツールのみ |
| トークン消費 | ツール定義の重み × 呼び出し回数 | -40〜62% |
| 新ツール追加 | 既存に積み上げ | 追加 → 翌日監査で評価 |
| 使われないツール | 永久に残る | 一定期間で自動削除候補 |
| 監査の粒度 | 月次レビュー | 日次自動レポート |
| 削減の意思決定 | 人間が判断 | 監査エージェントが提案 + 人間承認 |
| 品質劣化リスク | 「念のため残す」で膨張 | A/B 検証で安全に削除 |
つまり「MCP プルーニング + 日次監査」は、「動くから残しておく」属人運用から 「毎日定量的に評価して削ぎ落とす」運用文化への構造変化を意味します。
受託案件で活きる 3 つの構造変化
構造 1: 「ツール追加文化」から「ツール削減文化」へ
受託案件では **「とりあえず使うかもしれない MCP ツール」を初期に大量登録する傾向があります。6 ヶ月で使われていないツールが 40〜60% という調査結果もあり、これらが 毎回のコンテキストを膨張させてきました。日次プルーニングを組み込むことで、「追加と同じくらい削減を意識する文化」**が生まれます。これは GitHub エージェント Workflow トークン効率化受託 で扱った コンテキスト最小化の ツール層への拡張です。
構造 2: 「月次レビュー」から「日次自動監査」へ
従来の受託では 月次レポートで使用状況を共有してきましたが、1 ヶ月分の膨張がすでに発生してから対応する後手運用でした。日次監査では 翌日には削減候補がレポート化され、週次で削減できます。これは GitHub Copilot 従量課金受託 で扱った 課金可視化を 「課金が積み上がる前に介入する」フローへ進化させます。
構造 3: 「人間判断」から「監査エージェント + 人間承認」へ
GitHub の事例の核は 「監査エージェントが削減候補を提案し、人間が承認する」フローです。受託では 承認ワークフローを Slack / Teams / GitHub PR に乗せることで、安全 + 高速な削減ループが実現します。これは 既存 API を MCP サーバー化する受託 で扱った MCP 設計パターンを 「ライフサイクル運用」まで含めた標準化です。
受託で提供する「MCP プルーニング + 日次監査」5 フェーズ
フェーズ 1: 現状監査(2〜3 週間)
- 登録 MCP ツールの棚卸し(数 / カテゴリ / 重み)
- 直近 30 日の使用頻度ヒートマップ
- コンテキスト消費分析(ツール定義 vs 実コンテンツ)
- コスト寄与度の Top 10 ツール
- 重複機能ツールの洗い出し
- 削減ポテンシャル試算(保守的 / 攻めの 2 ケース)
フェーズ 2: 削減ポリシー設計(2 週間)
- プルーニング閾値(例: 30 日未使用で候補化)
- 例外リスト(重要だが低頻度のツール)
- 削減承認フロー(自動 / Slack 承認 / PR レビュー)
- A/B 検証の品質指標(成功率 / 完了時間)
- ロールバック手順
- インシデント時のエスカレ
フェーズ 3: 監査基盤構築(3〜4 週間)
- MCP ツール使用ログ収集(標準ログ + カスタム計装)
- 日次集計バッチ(BigQuery / Snowflake / ClickHouse)
- 監査エージェント実装(Claude / GPT-5.5 ベース)
- 削減提案 → Slack / PR 自動投稿
- A/B 検証フレームワーク
- ダッシュボード(Looker Studio / Grafana)
フェーズ 4: パイロット → 全 Workflow 展開(3〜4 週間)
- パイロット 3 Workflow で稼働開始
- 1 週ごとの削減レビュー
- 品質劣化監視
- ベストプラクティス整理
- 横展開計画
フェーズ 5: 月次運用 + 改善ループ(継続)
- 月次の削減金額レポート
- 新規 MCP ツール追加レビュー(追加と同時に監査対象に)
- 品質指標トレンド分析
- ガードレール更新
- 半期ごとのプルーニング方針見直し
受託向け技術スタック標準セット
| レイヤ | 推奨技術 | 代替 |
|---|---|---|
| エージェントランタイム | GitHub Agentic Workflows / Claude Code | n8n / 内製 |
| MCP ホスト | Claude Code / Codex / Kiro Web | Cursor / 自前 |
| ログ収集 | OpenTelemetry + Loki / Datadog | CloudWatch + Athena |
| 集計 DWH | BigQuery / Snowflake / ClickHouse | Redshift |
| 監査エージェント | Claude Opus 4.8 / GPT-5.5 | 内製ルールエンジン |
| 承認 UI | Slack Bot / GitHub PR | Teams Bot |
| A/B 検証 | LaunchDarkly / 内製 | OpenFeature + 自作 UI |
| ダッシュボード | Looker Studio / Grafana / Superset | Tableau |
どの案件に必要か / 不要か
| 必要な案件 | 不要な案件 |
|---|---|
| 月間トークン課金が 50 万円超 | 試作 / PoC 規模 |
| MCP ツール数が 20 以上 | ツール数 5 以下で固定 |
| 複数 Workflow を並列運用 | 単一 Workflow のみ |
| 新規ツールを継続的に追加する文化 | 追加なしで固定運用 |
| 顧客に削減実績を報告したい | 報告不要の内部利用 |
受託契約に書く 6 つの条項
| 条項 | 内容 | 顧客が確認すべきこと |
|---|---|---|
| 削減 KPI | 月次の削減目標 + ベースライン | 報告先・承認者 |
| プルーニング判断権限 | 自動 / 承認必要の境界 | リスク区分別の権限者 |
| 品質保証 | A/B 検証の品質指標 | 劣化時の対応 |
| 監査ログ保持 | 期間 + 暗号化 + アクセス制御 | 法令・契約要件 |
| 削減金額の按分 | 削減成果の受託側インセンティブ有無 | 顧客側 KPI との整合 |
| 退場時引き渡し | 監査基盤 + ポリシー文書 | 自社運用継続性 |
価格モデル — MCP プルーニング + 日次監査受託パッケージ
| プラン | 金額 | 対象 | 内容 |
|---|---|---|---|
| MCP Audit | 80 万円 / 0 円 | 単発の使用状況監査 | 監査レポート + 削減提案 Top 5 |
| MCP Optimize Lite | 60 万円〜 / 月 | MCP ツール数 20〜50 | 日次監査 + 週次承認 + ダッシュボード |
| MCP Optimize Standard | 160 万円〜 / 月 | MCP ツール数 50〜200 / 複数 Workflow | + 監査エージェント + A/B 検証基盤 |
| MCP Optimize Plus | 340 万円〜 / 月 | 大規模 / 案件横断 | + 専任エンジニア + 月次経営報告 |
| 初期構築 | 450 万円〜(一括) | ログ + 監査エージェント + ダッシュボード | 全プラン共通オプション |
顧客側 ROI 試算(月間トークン課金 200 万円 / MCP ツール 80 個想定)
| 項目 | 既存 | 日次監査 + プルーニング導入後 | 差分 |
|---|---|---|---|
| 月間トークン課金 | 200 万円 | 80 万円 | -120 万円 / 月 |
| MCP ツール数 | 80 個 | 35 個 | -56% |
| エージェント応答時間 | 平均 12 秒 | 平均 5 秒 | -58% |
| ツール管理工数 | 月 30 時間 | 月 6 時間 | -24 時間 |
| 品質劣化(失敗率) | 4.2% | 4.0% | 横ばい |
| 年間効果 | — | — | 約 1,500 万円削減 + 応答速度倍増 |
時給 8,000 円換算で 年間 230 万円相当の工数削減 + トークン課金 1,440 万円削減。MCP Optimize Standard プラン(年額 1,920 万円)でも 14 ヶ月以内で回収可能で、応答速度向上による UX 改善は別途の業務効果です。
ハマりやすい 5 つの落とし穴
落とし穴 1: 「使われていないから即削除」
低頻度でも 「インシデント時にしか使わない」ツールは残す必要があります。例外リストを初期に丁寧に作ります。
落とし穴 2: 品質指標を監視しない
削減後に エージェントの完了率が低下するケースがあります。A/B 検証 + 品質指標ダッシュボードを必ず併設します。
落とし穴 3: 承認なしで自動削除
「日次で自動削除」にすると、重要ツールを誤削除するリスクが残ります。承認ステップ + 削除前 7 日通知を入れます。
落とし穴 4: 削減金額を顧客に共有しない
削減効果が 金額換算で顧客に伝わらないと、受託側の努力が見えません。月次レポートで「削減額」を明示します。
落とし穴 5: 新規ツールに監査適用しない
「新規追加ツールは半年は監視対象外」にすると、追加が止まらず再び膨張します。追加と同時に監査対象に組み込む運用が前提です。
90 日アクションプラン
| 週 | アクション |
|---|---|
| Week 1〜3 | MCP ツール棚卸し + 使用頻度ヒートマップ + 削減ポテンシャル試算 |
| Week 4〜5 | プルーニングポリシー + 例外リスト + 承認フロー設計 |
| Week 6〜9 | ログ + 監査エージェント + ダッシュボード構築 |
| Week 10〜11 | パイロット 3 Workflow 稼働 + 1 週ごとレビュー |
| Week 12 | 全 Workflow 展開 + ヘルプデスク FAQ |
| Week 13 | 月次運用レビュー初回 + 削減金額レポート |
まとめ — 「動くから残しておく」から「毎日定量的に削ぎ落とす」へ
GitHub の 日次監査 + MCP プルーニングによる 62% トークン削減は、「MCP ツールの肥大化」が 2026 年のエージェント運用最大のコスト要因であることを示しています。受託で AI エージェント基盤を運用する立場では、監査 + プルーニング + A/B 検証 + 経営報告を一体で提供する 「MCP プルーニング + 日次監査」が新しい主力サービスになります。
弊社では Audit / Lite / Standard / Plus の 4 段階で本パッケージを提供しています。「月間トークン課金が読めない」「MCP ツールが増えすぎてレスポンスが遅い」「削減効果を経営層に説明できない」というご相談は お問い合わせフォーム からお気軽にどうぞ。