「翻訳が機械っぽくて不自然」「業界用語が誤訳されてクレームになった」「更新のたびに翻訳が追いつかない」――海外向けの Web サイトや多言語コンテンツを運用する中小企業で、必ず出てくる悩みです。
2026 年 4 月、InfoQ がライドシェア大手 Lyft の AI × HITL(Human-in-the-Loop)ローカリゼーション 運用を紹介しました。Lyft は AI 翻訳を一次ドラフトに使い、人間の言語専門家がレビュー・修正して本番反映するというワークフローで、グローバル展開のスピードと品質を両立 しています。
もちろん Lyft の規模感(専門チーム・社内 NMT・CAT ツール群)をそのまま中小企業に持ち込むのは無理があります。しかし、設計思想は十分に応用可能 です。本記事では、Lyft の運用を「中小企業版 軽量 HITL」に再設計する考え方と、具体的なツール選定、そして Web サイト多言語対応ガイド の応用編としての実務設計を解説します。
Lyft の AI × HITL 翻訳運用とは
InfoQ 記事で紹介された Lyft の仕組みは、要素を抽象化すると 4 つのレイヤーで構成されています。
- 翻訳メモリ(TM)+ 用語集:過去翻訳の蓄積と、業界・ブランド独自の用語辞書
- AI 一次翻訳エンジン:社内 NMT + 商用 LLM のハイブリッド
- Human-in-the-Loop レビュー:言語専門家が差分だけを確認
- 継続学習ループ:レビュー結果を TM と用語集にフィードバック
ポイントは、人間が全文を翻訳するのではなく、AI が生成した結果の “信頼度の低い部分だけ” を確認する という設計です。これによって、品質を保ちながら翻訳スループットが数倍に跳ね上がります。
4 層の役割分担
| レイヤー | 担当 | 目的 |
|---|---|---|
| 翻訳メモリ / 用語集 | システム | 過去資産の再利用、用語の一貫性 |
| AI 一次翻訳 | モデル | スピード、コスト圧縮 |
| HITL レビュー | 人間 | 文化的配慮、ブランドボイス、法務 |
| 学習ループ | システム + 人間 | 継続的な品質向上 |
中小企業で最も省略されがちなのが「翻訳メモリ + 用語集」レイヤーです。ここを持たずに AI 翻訳だけに頼ると、用語がぶれる・過去資産が活きない・品質が安定しない という三重苦に陥ります。
中小企業で起きがちな多言語化の失敗パターン
Lyft の設計思想に戻る前に、まず弊社が相談を受けるケースで頻出する失敗を整理します。
失敗 1:Google 翻訳ウィジェットの埋め込みで “終わり” にする
サイトに 1 行のスクリプトを貼ると、訪問者が言語を切り替えられる。一見楽ですが、検索エンジンに多言語ページとして認識されず、SEO の恩恵がゼロ です。訳文の品質も一般汎用レベルに留まります。
失敗 2:一括機械翻訳の静的生成だけで放置
WordPress プラグイン等で全ページを機械翻訳して静的出力する方式。初期コストは下がりますが、ブランドボイスの反映、業界用語の正確性、法的表現の配慮 がなく、トラブルの温床になります。
失敗 3:人力翻訳を毎回発注するので更新が止まる
逆に人力翻訳だけに頼ると、単価が高く・時間がかかり・結果として更新が止まって陳腐化 します。特にリアルタイムに情報が変わる採用サイトや事例ページでは致命的です。
中小企業版「軽量 HITL」の設計
Lyft の 4 層モデルを中小企業サイズにダウンサイズすると、次のような設計になります。
レイヤー A:用語集と固有名詞リストを作る(必須)
Excel / スプレッドシートで構わないので、以下を 1 ファイルにまとめます。
- 自社サービス名・製品名の正式表記(日 / 英 / 中 / その他)
- 業界固有用語の対訳と “訳さない” 判定
- 役職名の社内ルール(例:代表取締役 = CEO / President)
- ブランドボイスのサンプル(カジュアル / フォーマルのどちらか)
このファイルの整備は 2〜3 時間で完了します。ここが無いと、何をやってもブレ続けます。
レイヤー B:AI 一次翻訳のツール選定
中小企業で現実的な選択肢は次の 3 つです。
| ツール | 強み | 向いているコンテンツ | 月額目安 |
|---|---|---|---|
| DeepL API | 自然な翻訳、用語集対応 | マーケティング系、長文記事 | 数千円〜(従量課金) |
| Google Cloud Translation | 対応言語数、安定性 | 短文、UI テキスト、大量処理 | 数千円〜(従量課金) |
| ChatGPT / Claude + プロンプト | トーン&マナー指示、文脈理解 | ブランドボイス重視の記事 | 月数万円〜 |
汎用ウェブサイトの本文は DeepL、UI 文字列は Google、ブランディング要素は LLM というハイブリッドが、コストと品質のバランス最良解です。DeepL は用語集機能(Glossary)で固有名詞を強制できるので、レイヤー A で作った用語集をそのまま流し込めます。
レイヤー C:HITL レビューの仕組み
ここが最重要です。誰が、どのタイミングで、何をレビューするか。
パターン 1:社内バイリンガルメンバーによる抜粋レビュー
社内に英語・中国語などが得意な人がいる場合、AI が生成した翻訳の 2〜3 割をサンプリングチェック する運用で十分なケースが多いです。重要ページ(トップ、サービス紹介、採用)は全量、更新頻度の高いブログは抜粋、という強弱をつけます。
パターン 2:外部ネイティブレビュアーとの定額契約
社内にリソースがない場合、クラウドソーシングや翻訳会社と月 10〜20 時間の定額契約 を結ぶのが現実的です。AI 一次翻訳とセットで運用すれば、完全人力翻訳の 1/3 以下のコストで同等品質が出せます。
パターン 3:重要コンテンツのみ人力、その他は AI 単独
FAQ、プライバシーポリシー、料金表など法的・契約的に重要な部分だけ人力翻訳し、ブログや事例はAI + 自動校正ツールに委ねる方式。スタートアップの初期フェーズではこれで十分成立します。
レイヤー D:学習ループを回す
HITL レビューで修正が入ったポイントを、次回以降に同じミスが起きないよう TM / 用語集に反映 する運用が必要です。修正を蓄積して、AI の初期翻訳精度が段階的に上がっていく状態を作ります。
シンプルには、スプレッドシートに修正ログを貯めて月 1 で用語集に反映する運用で十分機能します。Notion / Airtable を使うとチーム間共有がスムーズです。
AI 翻訳と SEO・UX の両立
AI 翻訳を組み込むうえで見落とされがちな 3 つの観点を整理します。
ポイント 1:hreflang と URL 構造
多言語サイトは、hreflang タグと URL 構造(サブディレクトリ /en/ / サブドメイン en.example.com / 独立ドメイン)の設計が SEO に決定的に効きます。翻訳品質以前に、検索エンジンに “この国のユーザーにはこのページ” を伝える 仕組みが重要です。
ポイント 2:AI Overview 時代のコンテンツ引用率
AI Overview 時代のコンテンツ戦略 で解説したように、2026 年は検索結果での “AI が要約する” 割合が急増しています。多言語サイトも例外ではなく、各言語での E-E-A-T(経験・専門性・権威性・信頼性) が評価軸になりつつあります。機械翻訳丸投げで権威性が下がると、AI Overview で引用されにくくなります。
ポイント 3:文化的ローカライズ vs 翻訳
「翻訳」と「ローカライゼーション」は別物です。日本語の「よろしくお願いします」を英語にそのまま訳しても意味が通じません。AI 翻訳でも、カスタムプロンプトで “文化的に自然な表現に置き換える” 指示を入れることで、この差を埋められます。LLM を使うメリットはここにあります。
導入ロードマップ(90 日プラン)
Month 1:基盤整備
- 用語集と固有名詞リストの作成(レイヤー A)
- 対応言語の決定(まずは 1〜2 言語に絞る)
- 現行サイトの構造監査(hreflang、URL、CMS の多言語機能確認)
- 翻訳ツールの選定と API 契約
既存サイトが多言語を前提とした作りになっていない場合、CMS やディレクトリ構造の見直しから必要になります。着手前に コーポレートサイトリニューアルの進め方 に目を通しておくと、多言語化と刷新の工程を重ねて計画でき、二重投資を避けられます。
Month 2:試験運用
- 優先度高のページ(トップ、サービス紹介、事例)を AI 一次翻訳
- レビュアーのアサインと修正フローの確立
- 修正ログの運用開始
- 初回公開と SEO 設定(hreflang など)
Month 3:拡大と学習
- ブログ・FAQ・採用ページなど対象範囲の拡大
- TM / 用語集のアップデート
- GA4 で言語別の訪問者行動を計測
- 月次レビュー会議で品質 / コスト / スピードを評価
まとめ ― “AI 全任せ” でも “人力全任せ” でもなく
Lyft の AI × HITL ローカリゼーション運用は、中小企業にそのまま持ち込むには重すぎますが、設計思想 ―― 用語集 → AI → HITL → 学習ループ の 4 層構造は、規模を問わず応用可能です。
重要な 3 つの学び:
- 用語集 + HITL がない AI 翻訳は、中長期で必ず崩壊する
- ツールの使い分け(DeepL / Google / LLM)で品質とコストが両立する
- 学習ループを回す ことで、AI の初期精度は時間とともに上がっていく
弊社 GleamHub では、多言語コーポレートサイトの構築 × AI 翻訳ワークフロー設計 を一体で提供しています。特に BtoB 企業の海外展開では、言語対応と同時にリード獲得の導線設計が重要になります。BtoB Web マーケティング入門 で整理したリード獲得の仕組みを、各言語バージョンで横展開する設計まで含めて支援可能です。インバウンド需要や海外取引の拡大を見据え、まずは用語集づくりと 1〜2 言語の試験運用から始める 90 日プログラムも用意しています。「何から始めればいいか」が決まっていない段階からのご相談も歓迎です。