Claude Code の登場から 1 年あまり、「とりあえず試す」フェーズから「実運用でどう回すか」のフェーズへと、明確にステージが変わりました。2026 年 4 月、Zenn Trending には Claude Code の実運用ノウハウ記事が連日上がり続けています。
- 「Claude Max 20x プランでも足りないので、トークン節約のためにやったこと 8 選」
- 「Claude Code のマルチセッション管理にジョブキューの概念を取り入れる」
- 「DevContainer で完結!Claude Code + Playwright MCP を使ったブラウザ操作自動化」
- 「DESIGN.md + 壊れたら気づくハーネス - AI 向けデザインシステムを “維持できる仕組み” にした記録」
どれも、数ヶ月前までは議論されていなかった 運用期特有の課題 です。機能紹介や事例紹介は他の記事に譲り、本記事では「組織として月額コストを半減しながら、品質と速度を両立する運用設計」にフォーカスします。
運用期に顕在化した 4 つの論点
Claude Code を本格的に日々の開発に組み込むと、多くのチームが次の 4 つの壁にぶつかります。
- セッション管理:複数タスクを並行して進めたいが、セッションを切り替えるたびにコンテキストが失われる
- トークンコスト:Claude Max 20x プラン(月 20 万円超)でも月中で使い切ってしまう
- 環境の再現性:メンバー間で動く / 動かないが頻発し、「自分の PC なら動いた」が起きる
- 品質劣化の検知:AI が生成したコードが少しずつ設計ガイドから外れていき、気づいた時には手遅れ
順に、2026 年春時点で効く対策を見ていきます。
論点 1:マルチセッション管理 × ジョブキュー設計
Claude Code は 1 セッション 1 タスクを前提に設計されていますが、実務では「この機能は午前中から AI に任せて、午後までに別タスクをぶつけたい」という場面が頻発します。ナイーブに新しいセッションを開くと、プロジェクトの CLAUDE.md や過去の文脈が十分に引き継がれず、毎回ゼロから説明し直すコストが発生します。
パターン A:タスクキュー × 長命セッション
タスクをチケット単位でキューに積み、長命の main セッション を 1 本維持して、そこにキューから 1 件ずつ流し込むアプローチです。Zenn で紹介されているジョブキュー方式は、この考え方を発展させたものです。
- 利点:コンテキストが温まったままなので、類似タスクの 2 件目以降はプロンプトが短くて済む
- 欠点:長時間セッションは途中で context が膨らみすぎて精度が落ちるリスクあり
- 対策:
/compactを 30 分〜1 時間おきに挟む、または/clearで思い切ってリフレッシュ
パターン B:ワークツリー別セッション
Git worktree を使って、ブランチごとに別ディレクトリ・別セッションで並列開発する方式です。Claude Code の using-git-worktrees スキルとも整合します。
- 利点:タスク間の干渉がゼロ、並列度が上がる
- 欠点:各セッションでコンテキストを再構築する必要がある、VS Code などで混乱しがち
- 対策:各 worktree の CLAUDE.md をプロジェクト共通化し、ローカルは最小限の差分のみ記述
パターン C:Remote Control(/rc)で一元化
Claude Code の Remote Control 機能を使い、1 台の “ホスト PC” で動く 1 セッションを、スマホや別 PC から遠隔操作する方式です。Claude Code の /rc とは?Remote Control でセッションをどこからでも操作する方法 で詳しく紹介しましたが、運用設計的にも有効です。
- 利点:コンテキストは常に 1 つ、端末を跨いでも継続できる
- 欠点:並列作業は苦手、単一障害点になりやすい
- 対策:ホスト PC の可用性を上げる、バックアップホストの設計
論点 2:トークン節約 8 パターン
Claude Code の運用費が跳ね上がる最大の要因は、毎回のセッション起動時の context 読み込み です。プロジェクトが大きくなるほど、この初期コストが効きます。
1. CLAUDE.md の圧縮
CLAUDE.md は全会話の冒頭で読み込まれるため、ここに書くのは「知っていないと事故るルール」だけ に絞ります。コーディング規約の細則や、一般的なプロジェクト情報は別ファイルに分離し、必要時だけ参照する構成に。
2. /clear の適切な使用
長時間のセッションで context が 50% を超えたら、ためらわず /clear。意図して圧縮するほうが、auto-compact よりコンテキストの質が保てます。
3. ファイル読み込みのスコープ限定
Read ツールで offset / limit を指定し、必要な行のみを取得。ディレクトリ全体を ls -R するような操作は最後の手段に。
4. Grep ファーストの探索
コードベースで何かを探すとき、ファイルを開く前に Grep で候補を絞る。これだけで 1 タスクあたり数千〜数万トークン節約できます。
5. サブエージェントへの委譲
広範な探索や独立タスクは、サブエージェント(Task / Agent)に委譲してメインコンテキストの汚染を防ぐ。サブエージェントは終わったらサマリーだけ返してくるので、元の文脈が保たれます。
6. Plan モードの活用
大きな変更は、最初に Plan モードで計画だけ立て、ユーザー承認後に実装。「間違った方向に 3000 トークン進んで巻き戻す」のコストが消えます。
7. プロンプトキャッシュの意識
Anthropic の API はプロンプトキャッシュ(5 分 TTL)を持っています。同じプロジェクトで立て続けに操作すると、キャッシュヒットでコストが大幅に下がる。1 日に細切れで 10 回使うより、30 分集中して使うほうが安いのはこのためです。
8. モデルの使い分け
全タスクを Opus で走らせず、定型的なタスクや探索系は Haiku / Sonnet に切り替え。/model コマンドでセッション内でも切替可能です。
トークン節約の効果目安
弊社で運用しているいくつかのプロジェクトで、上記 8 パターンを組織的に導入した結果、月間トークン消費量を 40〜50% 削減 できました。開発速度は変わらず、むしろプラン / 実装が明確に分かれたことで品質が上がっています。
論点 3:DevContainer で「動く環境」を再現する
個人利用では気にならない環境差分が、チーム利用では毎回ノイズになります。特に Claude Code では、MCP サーバーの設定・Node バージョン・Playwright のブラウザバイナリ・Git 設定など、再現性のない構成が事故の温床 になります。
DevContainer × Claude Code の標準構成
Zenn で紹介されている DevContainer + Claude Code + Playwright MCP の構成は、以下のファイル配置が基本です。
.devcontainer/
devcontainer.json ← 開発コンテナの定義
Dockerfile ← Node / Python / Playwright を入れる
.claude/
settings.json ← Claude Code の設定(MCP サーバー、hooks など)
CLAUDE.md ← プロジェクトルール
.mcp.json ← MCP サーバーの共有設定
devcontainer.json で Claude Code 本体をインストールしてしまうと、VS Code を開くだけで環境が揃い、新しいメンバーのオンボーディングが 30 分で完了 します。
Playwright MCP で「見る」能力を足す
Claude Code は基本はテキストベースの操作ですが、Playwright MCP を組み合わせると「ブラウザで実際にページを開き、スクリーンショットを撮り、UI を確認する」までを自律的にこなせます。
UI の自動テストや E2E の検証タスクで特に威力を発揮します。弊社では、画像最適化の実装確認やアクセシビリティ監査など、CDN × 画像最適化でサイト表示速度を改善 のような Web 改善タスクで併用しています。
MCP サーバーは “過剰” にしない
MCP サーバーは便利なぶん、追加するたびに context を消費 します。プロジェクトで本当に使うサーバーだけに絞り、使わなくなったものは外す運用を。自社 MCP サーバーの構築については 自社 MCP サーバー群の構築実務ガイド で詳しく解説しています。
論点 4:壊れたら気づくハーネス設計
運用期最大の敵は、「静かに品質が劣化していく」ことです。AI が生成したコードが、個別には問題なさそうに見えるのに、プロジェクト全体の一貫性から少しずつ外れていく。気づいた時には、デザイントークンがバラバラだったり、コンポーネントの命名規則が 3 世代混在したりしています。
DESIGN.md + ハーネスの考え方
Zenn で共有された「DESIGN.md + 壊れたら気づくハーネス」のアプローチは、次の 2 層構造です。
- DESIGN.md:デザインシステム・設計原則を AI が読める粒度で文書化
- ハーネス:CI で自動実行される検査スクリプト群。DESIGN.md に反した変更を検知して落とす
このアプローチの肝は、「ドキュメントとチェックがペアで存在する」 ことです。人間のレビューに頼らず、AI が逸脱したら CI が赤くなる仕組みにしておくと、レビュー工数が爆発的に減ります。
ハーネスの具体例
- デザイントークン検査:ハードコーディングされた色コードを検出して失敗
- 命名規則チェック:コンポーネント命名の Prefix / Suffix を lint で強制
- アクセシビリティ回帰:axe-core の自動テストで WCAG 違反を検知
- バンドルサイズ限界:size-limit で増加を監視
これらは人間が書いたコードでも効きますが、AI 生成コードのほうが逸脱のパターンが画一的で、ハーネス化に向いています。
仕様からコードまでの三層設計
ハーネスの考え方を上流に拡張したのが、Spec・Context・Harness 三層設計で発注者が失敗しない伴走術 で整理した “Spec / Context / Harness” のフレームワークです。要件定義から運用まで、AI と人間の責任分担を一貫して設計する考え方で、Claude Code 運用のメンタルモデルとしても有用です。
運用設計のチェックリスト
自組織で Claude Code 運用を見直すときの最低限のチェック項目を置いておきます。
| 項目 | Yes/No |
|---|---|
| CLAUDE.md が「事故防止ルール」に絞られている | |
/clear を使うタイミングがチームで共有されている | |
| サブエージェントへの委譲基準が明文化されている | |
| モデル使い分け(Opus/Sonnet/Haiku)のルールがある | |
| DevContainer が整備され、新メンバーが 30 分で動かせる | |
| MCP サーバーは必要最小限に絞られている | |
| DESIGN.md に相当する設計原則ドキュメントがある | |
| CI でハーネス(lint / テスト / 回帰)が走っている | |
| トークン消費の月次レポートが取得できる |
半分以下しか Yes にならないなら、月額コストの最適化余地はかなり大きいはずです。
まとめ
Claude Code は、機能ではなく運用で差がつく フェーズに入りました。マルチセッション・トークン節約・DevContainer・ハーネスの 4 つの論点を整理し、組織として回す仕組みに落とし込むことで、月額コストを半減しながら品質と速度を両立できます。
弊社 GleamHub では、Claude Code を中心とした AI 駆動開発ワークフローの構築支援 を行っています。開発チームへのオンボーディング、CLAUDE.md / DESIGN.md の整備、MCP サーバーの導入設計、ハーネスの構築まで、実運用で効く形で一気通貫に整えます。「試してみたけどコストが読めない」「メンバー間で品質がバラつく」そんな状態から、“AI と一緒に回せる開発組織” への転換をお手伝いします。