Sakana AI「Namazu」とは?日本語特化LLMの実力をClaude・GPTと比較検証 | GH Media
URLがコピーされました

Sakana AI「Namazu」とは?日本語特化LLMの実力をClaude・GPTと比較検証

URLがコピーされました
Sakana AI「Namazu」とは?日本語特化LLMの実力をClaude・GPTと比較検証

Namazuが解決する「海外LLMの日本語問題」

2026年3月24日、Sakana AIは日本語に特化したLLMシリーズ「Namazu(α版)」と、それを搭載したAIチャットサービス「Sakana Chat」を公開しました。

海外製の大規模言語モデルをそのまま日本語で使うと、いくつかの問題が発生します。

  • 回答拒否: 政治・歴史・外交に関する質問で過剰にフィルタリングされる
  • 文化的バイアス: 日本固有の文脈(法制度、ビジネス慣習など)への理解が浅い
  • 不自然な日本語: 直訳的な表現や、日本語話者が使わないフレーズ

Namazuはこれらの問題を「事後学習」という独自技術で解決しています。

Namazuの技術的アプローチ — 事後学習とは

Namazuの核心は、既存の高性能モデルをベースに、日本仕様へ適応させる事後学習技術です。モデルをゼロから作るのではなく、DeepSeekやLlamaなどの基盤モデルの性能を維持しながら、日本での利用に適した振る舞いに調整します。

モデルラインナップ

モデルベースモデルパラメータ規模
Namazu-DeepSeek-V3.1-TerminusDeepSeek-V3.16,850億
Llama-3.1-Namazu-405BLlama 3.14,050億
Namazu-gpt-oss-120BGPT-oss1,200億

回答拒否率の劇的改善

最も目を引く成果は、回答拒否率の改善です。

ベースモデルのDeepSeek-V3.1-Terminusが政治・歴史・外交に関する質問の72%で回答を拒否していたのに対し、Namazuではほぼ0%にまで改善。推論・知識・コーディング性能はベースモデルとほぼ同等を維持しています。

ベンチマーク評価

Namazuは3つの観点で評価されています。

評価軸結果
基礎能力(MMLU-Redux, GPQA等)ベースモデルとほぼ同等の推論・知識・コーディング性能
中立性・事実正確性独立評価で3モデルすべてがベースモデルから改善
日本語能力(Nejumi, Swallow等)同規模モデルと同等の日本語性能

Sakana Chatの使い方

Sakana Chatは無料・アカウント登録不要で利用できます。

  1. chat.sakana.ai にアクセス
  2. モデルを選択(デフォルトはNamazu-DeepSeek-V3.1-Terminus)
  3. 質問を入力して送信

Web検索機能が統合されており、リアルタイム情報を含む回答が可能です。ただし、日本国内からのアクセスに限定されています。

Claude・GPTとどう使い分けるか

Namazuは万能型ではなく、特定のユースケースで力を発揮します。

ユースケース推奨モデル理由
日本の政治・歴史・外交Namazu回答拒否がなく中立的な回答を得られる
日本語の自然な文章作成Namazu / Claude文化的文脈を踏まえた表現
高度なコーディングClaude / GPT開発ツール統合と実績
データ分析・推論Claude / GPTベンチマークスコアで優位
機密データの処理Namazu日本国内で完結する選択肢として
無料で手軽に試したいNamazu(Sakana Chat)登録不要・無料

ソブリンAIとしての可能性

Namazuの真価は「日本語性能」だけでなく、データ主権(ソブリンAI) の文脈にもあります。海外サービスにデータを送信せず、日本のインフラ上でAIを運用したい企業にとって、Namazuは有力な選択肢になり得ます。

現時点での制約

α版であることを踏まえ、以下の点には注意が必要です。

  • 詳細なベンチマークスコアと技術レポートは後日公開予定
  • APIは未提供(Sakana Chat経由のWebアクセスのみ)
  • モデルウェイトはHugging Faceで公開されているが、商用ライセンスはベースモデルに依存

まとめ

Sakana AIのNamazuは「日本語LLMを一から作る」のではなく、「海外の最強モデルを日本仕様に変える」という実用的なアプローチを取っています。

  • 事後学習技術により、回答拒否率72% → ほぼ0%を実現
  • Sakana Chatは無料・登録不要で、Web検索機能も統合済み
  • ClaudeやGPTの代替ではなく補完的な選択肢として使い分けるのが現実的

技術レポートの正式公開と、API提供の開始が次の注目ポイントです。日本語AIの選択肢が増えることは、ユーザーにとって歓迎すべき進展でしょう。

関連記事

URLがコピーされました

グリームハブ株式会社は、変化の激しい時代において、アイデアを形にし、人がもっと自由に、もっと創造的に生きられる世界を目指しています。

記事を書いた人
照屋 塁
照屋 塁

ITベンチャー創業の元社会人野球選手。変化の早い世の中の波に乗り、世の中に価値あるサービスを出していきたい!と思い会社を設立

関連記事