2026年3月17日、OpenAIは最新の小型モデル「GPT-5.4 mini」と「GPT-5.4 nano」を正式リリースしました。
GPT-5.4 フラッグシップモデルのリリース(3月5日)からわずか12日後という驚異的なスピードでの展開。これらは OpenAI が「これまでで最も優れた小型モデル」と位置づける製品であり、開発者・企業にとって見逃せないアップデートです。
GPT-5.4 mini とは? — 旗艦モデルに迫る性能を小型で実現
前世代から「2倍以上高速」で、性能も別次元
GPT-5.4 mini の最大の特徴は、前世代の GPT-5 mini と比べて 2倍以上高速になりながら、コーディング・推論・マルチモーダル理解・ツール使用のすべてにおいて大幅な性能向上を達成したことです。
特筆すべきは、一部のベンチマークでフラッグシップモデル「GPT-5.4」にほぼ肩を並べていること。小型モデルとして、これは異例の達成です。
ベンチマークで見る実力
| ベンチマーク | GPT-5.4(旗艦) | GPT-5.4 mini | GPT-5 mini(旧世代) |
|---|---|---|---|
| SWE-Bench Pro(コーディング) | 57.7% | 54.4% | 45.7% |
| OSWorld-Verified(PC操作) | 75.0% | 72.1% | 42.0% |
| Terminal-Bench 2.0 | — | 60.0% | — |
OSWorld-Verified は「AIがPC画面のスクリーンショットを見ながら操作を完結させる」難易度の高い評価で、人間のベースラインは 72.4%。GPT-5.4 mini の 72.1% はほぼそれに匹敵します。
サポートする機能
API では以下の機能すべてに対応しています:
- テキスト・画像入力(マルチモーダル)
- ツール使用・Function Calling
- Web検索・ファイル検索
- Computer Use(PC操作の自動化)
- Skills(カスタム能力の付与)
GPT-5.4 nano とは? — コストと速度を極限まで最適化
「最小・最安・最速」のGPT-5.4ファミリー
GPT-5.4 nano は、GPT-5.4 ファミリーの中で最もコンパクトなモデルです。速度とコストを最優先するタスク向けに設計されており、分類・データ抽出・ランキング・シンプルなコーディングのサブエージェントなどに適しています。
nano のベンチマーク
| ベンチマーク | GPT-5.4 nano | GPT-5 mini(旧世代) |
|---|---|---|
| SWE-Bench Pro | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 46.3% | — |
| OSWorld-Verified | 39.0% | 42.0% |
OSWorld-Verified(PC操作)では旧世代に劣りますが、コーディング系のベンチマークでは旧世代を超えています。nano は PC 操作向けではなく、テキスト処理・コード解析などの高速・大量処理向けとして設計されています。
なお、最大推論エフォートで実行した場合、GPT-5.4 nano は前世代の GPT-5 mini を上回るという報告もあります。
価格比較 — 驚くほどコスト競争力が高い
| モデル | 入力(100万トークンあたり) | 出力(100万トークンあたり) |
|---|---|---|
| GPT-5.4 mini | $0.75 | $4.50 |
| GPT-5.4 nano | $0.20 | $1.25 |
GPT-5.4 nano の $0.20/百万入力トークンという価格は、Google の Gemini 3.1 Flash-Lite より安価。試算では**$52 で約76,000枚の写真を説明できる**計算になります。
どこで使えるのか? — 利用可能なプラットフォーム
GPT-5.4 mini
- ChatGPT(Free・Goユーザー向け「Thinking」機能として)
- Codex(GPT-5.4 クォータの 30% 消費でより経済的に利用可能)
- OpenAI API
GPT-5.4 nano
- OpenAI API のみ(ChatGPT UI には未対応)
「サブエージェント」パターンが実用域へ
今回のリリースで注目したいのが、大規模モデルと小型モデルを組み合わせたサブエージェント構成の実用化です。
具体的なアーキテクチャ例(Codex)
GPT-5.4(旗艦)
└── タスク計画・調整・最終判断
GPT-5.4 mini(サブエージェント × 複数)
├── コードベースの検索
├── 大きなファイルのレビュー
└── 補足ドキュメントの処理
Codex では GPT-5.4 mini を使うと GPT-5.4 クォータの 30% のみ消費するため、単純なサブタスクを mini に委譲することで、コストを大幅に削減しながら生産性を高められます。
注意点 — mini は GPT-5.4 の完全な代替にはならない
すべてのタスクで mini が旗艦モデルを代替できるわけではありません。
超長文コンテキストの追跡精度(OpenAI MRCR v2 / 8 needles / 64K〜128K)では:
| モデル | スコア |
|---|---|
| GPT-5.4(旗艦) | 86.0% |
| GPT-5.4 mini | 47.7% |
非常に長いドキュメントで多数の詳細を同時に追う必要があるタスクでは、フラッグシップモデルの利用が引き続き推奨されます。
まとめ — 小型モデルの「新しい常識」
GPT-5.4 mini と nano のリリースは、AI の使い方に実質的な変化をもたらします。
| ポイント | 詳細 |
|---|---|
| コスト削減 | nano は Gemini Flash-Lite より安価 |
| 速度向上 | mini は前世代比 2倍以上高速 |
| 性能向上 | コーディング・推論で旧世代を大幅に超える |
| 実用的な構成 | 大型+小型のサブエージェント設計が実用域に |
「とにかく安く大量処理したい」なら nano、「速くて賢いモデルをコストを抑えて使いたい」なら mini、と使い分けるのが基本方針です。
今後、さらに小型モデルの性能が向上し速度が増すにつれて、「大型モデルが判断し、小型モデルが大量実行する」というアーキテクチャはますます主流になっていくでしょう。
グリームハブ株式会社では、このような最新AIモデルを活用したシステム構築・コンサルティングを行っています。AI活用に関するお問い合わせは、お気軽にご連絡ください。