「現場の Excel 集計や基幹システムの転記、いまだに RPA で動かしているけれど、ロボットが頻繁に止まる」——RPA 導入から数年経った企業の情シスから、こうした相談が増えています。画面の微妙なレイアウト変更で止まる脆さ、ライセンス費の高止まり、シナリオ保守の属人化が、RPA 第二世代のリプレース需要を生み出しています。
そこに刺さってきたのが、Anthropic の Computer Use API です。スクリーンショットを LLM に渡し、座標やキー入力を返させる発想で、ピクセル位置に依存せず「画面の意味」で操作するため、UI 変更に強い自動化が組めます。本記事では、Computer Use を業務自動化のエンジンとして据える際の設計指針を、受託開発の現場目線で整理します。

なぜ Computer Use が「RPA 第二世代」なのか
従来 RPA との最大の違いは、画面要素の特定方法です。
| 観点 | 従来 RPA(UiPath / WinActor 等) | Computer Use |
|---|---|---|
| 画面要素の特定 | XPath・座標・画像マッチング | スクリーンショット + LLM の視覚理解 |
| UI 変更時の挙動 | レイアウトが変わると停止 | 「申請ボタン」を意味で探せる |
| シナリオ作成 | レコーダー or GUI ビルダー | 自然言語の指示書 |
| 例外処理 | 個別に分岐を書く | プロンプトで方針を伝えられる |
| 単価 | フロー本数 × 年額ライセンス | API のトークン課金 |
特に「年に数回しか動かない決算処理を RPA 化したいが、ライセンス費が見合わない」というロングテール業務に、トークン課金の Computer Use はフィットします。
受託で導入する際の 4 つの設計判断
Computer Use を本番に乗せる前に、受託開発の見積前段階で必ず合意しておきたい論点が 4 つあります。
1. 実行環境 — 仮想デスクトップを「使い捨て」にできるか
Computer Use は実行中に任意のクリック・キー入力を生成します。本番業務 PC で直接動かすのは、操作ミス時の影響範囲が読めないため避けるべきです。Docker + noVNC、もしくはクラウドの仮想デスクトップ(Workspaces / WorkSpaces Web / Cloud Workstations)を使い捨てで立ち上げる構成を推奨します。
2. ガードレール — 「危険操作」をプロンプトで止められない前提
LLM は指示が曖昧だと、データ削除や送信ボタンを押す可能性があります。プロンプトでの抑止だけに頼らず、外部のポリシーレイヤーで「破壊的操作はヒューマンレビュー必須」を強制します。具体的には次の 3 段構えです。
- ホワイトリスト URL — アクセス可能なドメイン・サブパスを限定
- キーワードガード — 「削除」「送信」「決定」を検知したら一時停止
- 承認キュー — 重要操作はチケット化し、人が承認したら次のスクリーンショットを返す
3. プロンプト保守 — シナリオは「指示書」として SCM 管理
レコーダー文化に慣れた現場では「プロンプトをどこに保存するか」が抜けがちです。Markdown の指示書をリポジトリで管理し、PR レビュー対象にする運用を最初から組み込みましょう。これは 自社 MCP サーバー群の構築実務ガイド 2026 年版 と同じ発想で、AI を扱う業務資産はコードと同じ重みで版管理する必要があります。
4. コスト試算 — トークン課金を「ジョブ単価」に翻訳する
経営層に説明するとき、トークン課金のままでは意思決定できません。1 ジョブあたりのスクリーンショット枚数 × 平均トークン数 × 単価を測定し、「請求書発行 1 件あたり 8 円」のような単位に翻訳しておくと、RPA ライセンスとの ROI 比較がしやすくなります。
PoC で検証すべき 3 つの業務パターン
社内のどこから着手するか迷ったら、次の 3 パターンが PoC のヒット率が高いです。
- 既存システムへの転記作業 — 受発注システム → 会計、CRM → MA など。インターフェース変更頻度が低く、トークン消費も読みやすい
- 画面しかない外部 SaaS の操作 — API がない古い SaaS や、自治体の電子申請ポータルなど
- 報告書の自動生成 — 複数システムからスクショを取り、所定フォーマットに貼り付けて Slack 投稿まで
逆に、ミリ秒精度の処理や、1 日 1 万件以上の高頻度バッチは Computer Use ではなく、API 連携や Hono + Cloudflare Workers のエッジ API 基盤 のような正攻法が向きます。
まとめ — Computer Use は「ロングテール業務の救世主」
Computer Use は、すべての RPA を置き換える銀の弾丸ではありません。しかし、API がない/頻度が低い/業務知識が必要という三重苦の業務に対しては、これまで採算が合わなかった自動化を一気に現実化する力を持っています。
GleamHub では Computer Use の PoC から本番運用設計、ガードレールとコスト管理の仕組み化までを伴走支援しています。「現行 RPA を整理しなおしたい」「年数回業務を半自動化したい」といったご相談は、ぜひ お問い合わせ からお寄せください。