Namazuが解決する「海外LLMの日本語問題」
2026年3月24日、Sakana AIは日本語に特化したLLMシリーズ「Namazu(α版)」と、それを搭載したAIチャットサービス「Sakana Chat」を公開しました。
海外製の大規模言語モデルをそのまま日本語で使うと、いくつかの問題が発生します。
- 回答拒否: 政治・歴史・外交に関する質問で過剰にフィルタリングされる
- 文化的バイアス: 日本固有の文脈(法制度、ビジネス慣習など)への理解が浅い
- 不自然な日本語: 直訳的な表現や、日本語話者が使わないフレーズ
Namazuはこれらの問題を「事後学習」という独自技術で解決しています。
Namazuの技術的アプローチ — 事後学習とは
Namazuの核心は、既存の高性能モデルをベースに、日本仕様へ適応させる事後学習技術です。モデルをゼロから作るのではなく、DeepSeekやLlamaなどの基盤モデルの性能を維持しながら、日本での利用に適した振る舞いに調整します。
モデルラインナップ
| モデル | ベースモデル | パラメータ規模 |
|---|---|---|
| Namazu-DeepSeek-V3.1-Terminus | DeepSeek-V3.1 | 6,850億 |
| Llama-3.1-Namazu-405B | Llama 3.1 | 4,050億 |
| Namazu-gpt-oss-120B | GPT-oss | 1,200億 |
回答拒否率の劇的改善
最も目を引く成果は、回答拒否率の改善です。
ベースモデルのDeepSeek-V3.1-Terminusが政治・歴史・外交に関する質問の72%で回答を拒否していたのに対し、Namazuではほぼ0%にまで改善。推論・知識・コーディング性能はベースモデルとほぼ同等を維持しています。
ベンチマーク評価
Namazuは3つの観点で評価されています。
| 評価軸 | 結果 |
|---|---|
| 基礎能力(MMLU-Redux, GPQA等) | ベースモデルとほぼ同等の推論・知識・コーディング性能 |
| 中立性・事実正確性 | 独立評価で3モデルすべてがベースモデルから改善 |
| 日本語能力(Nejumi, Swallow等) | 同規模モデルと同等の日本語性能 |
Sakana Chatの使い方
Sakana Chatは無料・アカウント登録不要で利用できます。
- chat.sakana.ai にアクセス
- モデルを選択(デフォルトはNamazu-DeepSeek-V3.1-Terminus)
- 質問を入力して送信
Web検索機能が統合されており、リアルタイム情報を含む回答が可能です。ただし、日本国内からのアクセスに限定されています。
Claude・GPTとどう使い分けるか
Namazuは万能型ではなく、特定のユースケースで力を発揮します。
| ユースケース | 推奨モデル | 理由 |
|---|---|---|
| 日本の政治・歴史・外交 | Namazu | 回答拒否がなく中立的な回答を得られる |
| 日本語の自然な文章作成 | Namazu / Claude | 文化的文脈を踏まえた表現 |
| 高度なコーディング | Claude / GPT | 開発ツール統合と実績 |
| データ分析・推論 | Claude / GPT | ベンチマークスコアで優位 |
| 機密データの処理 | Namazu | 日本国内で完結する選択肢として |
| 無料で手軽に試したい | Namazu(Sakana Chat) | 登録不要・無料 |
ソブリンAIとしての可能性
Namazuの真価は「日本語性能」だけでなく、データ主権(ソブリンAI) の文脈にもあります。海外サービスにデータを送信せず、日本のインフラ上でAIを運用したい企業にとって、Namazuは有力な選択肢になり得ます。
現時点での制約
α版であることを踏まえ、以下の点には注意が必要です。
- 詳細なベンチマークスコアと技術レポートは後日公開予定
- APIは未提供(Sakana Chat経由のWebアクセスのみ)
- モデルウェイトはHugging Faceで公開されているが、商用ライセンスはベースモデルに依存
まとめ
Sakana AIのNamazuは「日本語LLMを一から作る」のではなく、「海外の最強モデルを日本仕様に変える」という実用的なアプローチを取っています。
- 事後学習技術により、回答拒否率72% → ほぼ0%を実現
- Sakana Chatは無料・登録不要で、Web検索機能も統合済み
- ClaudeやGPTの代替ではなく補完的な選択肢として使い分けるのが現実的
技術レポートの正式公開と、API提供の開始が次の注目ポイントです。日本語AIの選択肢が増えることは、ユーザーにとって歓迎すべき進展でしょう。
関連記事
- Gemma 4をローカルで動かす実践ガイド — もう1つの注目オープンモデル
- ChatGPT業務活用ガイド ― 中小企業の実務で使える10のプロンプト — LLMのビジネス活用例
- Claude Code vs Cursor 徹底比較 — AI開発ツールの選び方