Railway × Google Cloud 8時間停止 ─ 受託で設計する SaaS 事業継続 2026

2026 年 5 月 30 日、InfoQ が Google Cloud Suspends Railway Production Account, Causing Eight-Hour Platform-Wide Outage を公開しました。Railway（Heroku 後継として注目されてきた PaaS）の 本番 Google Cloud アカウントが自動検知システムにより一時凍結され、全顧客のサービスが 8 時間停止する事態が発生。Railway 側に違反はなく、Google Cloud の誤検知 + 自動アクションが原因でしたが、Railway 顧客の 数千の本番アプリケーションが 連絡なしに止まる結果になりました。

受託で中堅企業の 自社プロダクト / SaaS 事業を支える立場では、これは **「クラウドベンダーへの絶対信頼」という前提が 2026 年から崩壊したことを意味します。インフラ障害ではなく、アカウント凍結というガバナンス面のリスクが、マルチクラウド DRの 必要十分条件を書き換えました。これまで AWS Interconnect マルチクラウド受託（GH Media）で扱った 物理層の閉域接続、AWS DevOps Agent マルチクラウド AIOps（GH Media）で扱った 運用層の AIOps、Cloudflare 自律エージェント口座受託（GH Media）で扱った ガバナンス層の対策と接続して、「SaaS 事業継続」**を 受託パッケージとして整理します。

なぜ「アカウント凍結リスクが分水嶺」なのか

観点	既存 DR（インフラ障害想定）	2026 年 DR（アカウント凍結想定）
想定リスク	リージョン障害 / NW 断 / インスタンス停止	+ アカウント停止 / 規約違反疑い / 自動検知誤動作
RTO/RPO	リージョン間切替	+ ベンダー間切替
データの所在	同一クラウド内マルチリージョン	+ 別クラウドへの常時レプリカ
コントロール面	コンソール + API	+ 別ベンダー側のスタンバイ環境
連絡経路	サポートチケット	+ 法務 / 広報 / カスタマーサクセス
回復手段	フェイルオーバー	+ 別ベンダーでフルスタック再構築
業務影響範囲	エンドユーザー停止	+ 自社業務全停止（メール / 会議含む）
保険適用	クラウド SLA	+ サイバー / 業務中断保険

つまり 2026 年の DR は 「クラウドが落ちる」だけでなく「クラウドが自社を切る」シナリオを 第一級リスクとして扱う 構造変化です。

受託案件で活きる 3 つの構造変化

構造 1: 「マルチリージョン」から「マルチベンダー」へ

中堅企業の SaaS / 自社プロダクトは 「東京 + 大阪リージョン」で DR を組んできましたが、同一クラウドのアカウント凍結で 両方同時に停止します。受託では AWS + Google Cloud / AWS + Azure の マルチベンダー前提で 常時稼働 or ホットスタンバイを設計します。これは AWS Interconnect マルチクラウド受託（GH Media）で扱った 閉域接続の 業務継続レイヤ版です。

構造 2: 「フェイルオーバー手順書」から「常時並走 + 自動切替」へ

8 時間停止は 手順書ベースの DRでは救えません。DNS / グローバルロードバランサー / ヘルスチェックで 自動切替を組み込み、重要顧客には別ベンダー側の Active 環境を用意します。これは AWS DevOps Agent マルチクラウド AIOps（GH Media）で扱った AIOpsの 自動切替判断への発展です。

構造 3: 「インフラ DR」から「業務 DR」へ

クラウド凍結は メール / 会議 / SaaS 認証 / 経理 / 法務すべてを止めます。受託では Google Workspace + Microsoft 365 / Slack + Teams など 業務系の二重化まで含めて 業務 DR 基盤を設計します。これは Cloudflare 自律エージェント口座受託（GH Media）で扱った エージェント側のガバナンスを、業務インフラ全体へ広げる発想です。

受託で提供する「SaaS 事業継続」5 フェーズ

フェーズ 1: 現状診断（2〜3 週間）

利用クラウド / SaaS / PaaS 棚卸し
ベンダーロックインスコアリング
データ所在 / バックアップ状況
既存 DR ドキュメントレビュー
アカウント凍結シナリオの洗い出し
BIA（Business Impact Analysis）

フェーズ 2: ターゲット設計（2〜3 週間）

RTO / RPO の業務別再定義（アカウント凍結を含む）
ベンダー組合せ選定（AWS + GCP / AWS + Azure / GCP + OCI）
データレプリケーション戦略
連絡経路 / エスカレ手順
インシデント対応 Runbook
ステークホルダー合意形成

フェーズ 3: 構築（4〜6 週間）

マルチベンダー基盤（IaC / Terraform / OpenTofu）
データレプリケーション（DB / オブジェクトストレージ）
DNS / GSLB（Cloudflare / Route53 / Akamai）
監視 / SLO ダッシュボード
バックアップ / リストアテスト
法務 / 広報のテンプレ整備

フェーズ 4: パイロットフェイルオーバー（2〜3 週間）

限定顧客でフェイルオーバーテスト
データ整合性検証
RTO / RPO 計測
業務系（メール / 会議 / Slack）の切替テスト
教育 + 訓練

フェーズ 5: 月次運用レビュー（継続）

訓練 / 演習スケジュール
ベンダー側ポリシー / 規約変更追跡
レプリケーション健全性
業務影響シミュレーション
半期ごとの BCP 見直し

受託向け技術スタック標準セット

レイヤ	推奨技術	代替
クラウド	AWS / Google Cloud / Azure / OCI	Sakura / IIJ
IaC	Terraform / OpenTofu	Pulumi
データレプリケーション	Aiven Multi-Cloud / Debezium / Datastream	DMS / Striim
オブジェクトストレージ	S3 + GCS（双方向同期）	Cloudflare R2 + B2
DNS / GSLB	Cloudflare / Route53 / NS1	Akamai
業務系二重化	Google Workspace + Microsoft 365	Zoho + Notion
コミュニケーション	Slack + Teams + Discord	Mattermost
監視	Grafana Cloud / Datadog	New Relic

どの案件に必要か / 不要か

必要な案件	不要な案件
自社プロダクトでクラウドに本番依存	オンプレ完結
サービス停止 1 時間 = 損害 100 万円以上	バッチ処理のみ
監査要件（ISO 22301 / SOC2 / FISC）	監査対象外
グローバル顧客向け SLA を提示	国内限定
クラウド利用額が月 500 万円超	小規模ホスティング

受託契約に書く 6 つの条項

条項	内容	顧客が確認すべきこと
対象クラウド	AWS / Google Cloud / Azure / OCI / その他	範囲外サービス
RTO / RPO	業務別の目標値	コストとのバランス
テスト頻度	月次 / 四半期 / 半期	業務影響時間
データレプリ範囲	DB / オブジェクト / メタデータ	機微度別の扱い
退場時引き渡し	IaC / Runbook / 監視 / 訓練計画	自社運用継続性
インシデント時運用	24h / 法務 / 広報連動	エスカレ閾値

顧客側 ROI 試算（クラウド利用 1,500 万円 / 月、有償顧客 500 社想定）

項目	既存（単一クラウド + 手順書 DR）	マルチベンダー DR 導入後	差分
想定停止時間（年）	12 時間	1 時間	-11 時間
停止 1 時間の損害	800 万円	800 万円	—
年間停止損害（想定）	9,600 万円	800 万円	-8,800 万円
インシデント対応工数	600 時間 / 年	120 時間 / 年	-480 時間
監査対応工数	240 時間 / 年	80 時間 / 年	-160 時間
顧客解約による損失	年 5 社想定	年 1 社想定	+4 社継続
年間効果	—	—	約 1 億円相当のリスク削減 + 顧客信頼維持

時給 8,000 円換算で 年間 500 万円の工数削減 + 停止損害 8,800 万円回避。停止 1 時間あたりの損害が大きい事業ほど、二重化にかかる追加コストは短期で回収できる計算になります。まずは自社の BIA で「停止 1 時間の損害額」を出し、そこから逆算して投資判断するのが現実的です。

ハマりやすい 5 つの落とし穴

落とし穴 1: マルチクラウド = コスト 2 倍と思い込む

全資源を二重化するのではなく、機微度別に Active-Active / Active-Standby / Cold Standby を使い分けます。実コスト増は +15〜25% が現実的です。

落とし穴 2: データレプリケーションの整合性を放置

DB のスキーマ変更時に レプリ先で型不整合が起き、フェイルオーバー時に致命的データ破損する事故が頻発します。スキーママイグレーションを両ベンダー同期で実行する CI が必須です。

落とし穴 3: 業務系の二重化を忘れる

クラウドが落ちると Slack / Google Meet / 経理 SaaSも同時に止まることが多いです。メール / 会議 / 経理 / 法務の 代替経路を Runbook に明記します。

落とし穴 4: 訓練 / 演習をやらない

設計だけ立派で 本番フェイルオーバーは未実施の案件は、いざという時に動かない確率が高いです。四半期ごとの本番演習を必ず計画します。

落とし穴 5: ベンダー規約変更を追跡しない

クラウドベンダーの AUP / 規約 / 自動検知ポリシーは静かに変わります。規約変更ウォッチを運用契約に含めます。

90 日アクションプラン

週	アクション
Week 1〜3	棚卸し + BIA + ロックイン度スコア
Week 4〜5	ベンダー組合せ選定 + RTO/RPO 再定義
Week 6〜10	マルチベンダー基盤 + データレプリ + DNS
Week 11〜12	パイロットフェイルオーバー + 業務系切替
Week 12	全社展開 + Runbook 整備
Week 13	月次レビュー + 初回演習

まとめ — 「クラウドが落ちる」から「クラウドが自社を切る」へ進化する事業継続

Railway × Google Cloud の 8 時間停止は、「インフラ障害よりアカウント凍結のほうがダメージが大きい」ことを示しました。受託で中堅企業の SaaS / 自社プロダクトを支える立場では、マルチベンダー + データレプリ + DNS + 業務系二重化 + 訓練を一体で提供する 「SaaS 事業継続」が新しい主力サービスです。

マルチベンダー DR や業務系二重化の設計は、対象クラウドの構成・RTO/RPO・演習の頻度によって必要な工数が大きく変わるため、要件をうかがったうえで個別にお見積りします。「自社プロダクトが単一クラウドに依存」「アカウント凍結で同業他社が止まった」「国際 SLA を提示するには現状の DR で不十分」というご相談はお問い合わせフォームからお気軽にどうぞ。

Google Workspace の2段階認証とセキュリティ設定 — 管理者が締め出される前に

自社サイトがAIエージェントに「操作される」時代へ — WebMCPで予約・購入を取りこぼさない準備

脆弱性診断とは｜種類・費用相場・ツール・依頼先の選び方を中小企業向けに解説

Railway × Google Cloud 8時間停止 ─ 受託で設計する SaaS 事業継続 2026

なぜ「アカウント凍結リスクが分水嶺」なのか