GPT-5.4とは?何が変わったのか、誰が使えるのかをまとめる【2026年3月リリース】
2026年3月5日(日本時間6日)、OpenAIが最新のAIモデルGPT-5.4をリリースしました。
「また新しいモデルが出た」と思うかもしれませんが、今回は単なるマイナーアップデートではありません。 推論・コーディング・PC操作(エージェント)の3つの能力を1つのモデルにまとめたフロンティアモデルで、前バージョン(GPT-5.2)から性能が大きく向上しています。
この記事では、GPT-5.4が何者で、何ができるようになったのか、誰が使えるのかを整理します。
この記事はこんな人向けです
- GPT-5.4が出たと聞いたが、何が変わったのか分からない
- 自分が使えるのか、有料プランが必要なのか確認したい
- 前のモデルと比べて何がうれしいのか知りたい
GPT-5.4の概要:一言でまとめると?
GPT-5.4は、OpenAIが2026年3月5日にリリースした、推論・コーディング・エージェントワークフローの成果を1つのモデルに集約したフロンティアモデルです。ChatGPT・API・Codexの3プラットフォームで同日提供が開始されました。

これまでOpenAIは「推論が得意なモデル」「コーディングが得意なモデル」を別々に提供していた部分がありましたが、GPT-5.4はそれらを1つのモデルで全部こなせる設計になっています。
「何でも任せられるAIの司令塔」という表現が近いと思います。
GPT-5.4の主な新機能・変更点
① ネイティブ・コンピュータ操作(Computer Use)
GPT-5.4の最大の新機能が、AIがPCの画面を見てマウス・キーボードを自律的に操作できる機能です。
スクリーンショットを撮影・認識し、次のクリック先を判断し、キーボード入力を行う——これが一連の自律的なワークフローとして機能します。
従来のAIは「テキストで答えるだけ」でしたが、GPT-5.4は実際にアプリを開いて操作できるレベルに達しました。 GmailからメールToを送ったり、スプレッドシートを操作したり、ブラウザでリサーチをしたりが、指示するだけで完結します。
PC操作の精度を測るベンチマーク「OSWorld-Verified」では75.0%を達成しており、人間の基準(72.4%)を超えています。
② 思考の途中で指示を変えられる(Mid-Response Steering)
GPT-5.4 Thinkingは、長い思考を要する質問や詳細なウェブ検索に優れたモデルで、最大の進化として、モデルが思考している途中でユーザーが指示を追加したり、方針を調整したりできる機能が備わりました。
これは実際に使うとかなり便利です。「生成が始まってから方向が違うと気づいて最初からやり直し」という手間が減ります。
③ コンテキストウィンドウが100万トークンに
最大100万トークン(1M Context)のコンテキストウィンドウをサポートし、膨大なデータの一括処理が可能になりました。
これにより、数年分の会議録・社内規程・契約書などを一括で読み込ませた上での横断的な分析、といった使い方が現実的になります。 ただし、標準の272KBのコンテキストウィンドウを超えるリクエストは通常の2倍のレートでカウントされる点には注意が必要です。
④ Tool Search:トークン消費を47%削減
これはAPI活用者向けの機能です。従来はAPIで使えるツールをすべてシステムプロンプトに記述する必要があり、ツールが増えるほどトークンを大量消費していました。
新しいTool Searchは、必要なタイミングでツール定義を動的に検索できる仕組みで、大規模なツール群を持つシステムでのコストと速度を改善します。トークン消費を47%削減できるとされています。
⑤ ハルシネーション(誤情報)が33%減少
GPT-5.4はGPT-5.2比でハルシネーション33%減を達成しています。 事実の精度が上がることは、業務利用・情報収集での信頼性に直結します。
GPT-5.2と比べてどれくらい性能が上がったか
主要なベンチマークで、GPT-5.2からどれくらい向上したか見てみます。
| ベンチマーク | 測定内容 | GPT-5.2 | GPT-5.4 | 伸び |
|---|---|---|---|---|
| GDPVal | 知的実務処理 | 70.9% | 83.0% | +12.1pt |
| BrowseComp | Web調査力 | 約57% | 82.7% | +25.7pt |
| OSWorld | PC操作精度 | 約16% | 75.0% | +58.6pt |
| SWE-Bench Pro | 実務コーディング | 約54% | 57.7% | +3.8pt |
| Toolathlon | 複数ツール操作 | 約35% | 54.6% | +19.5pt |
旧モデルGPT-5.2と比べると、特にPC操作・Web探索・ツール利用に関するベンチマークの伸びは劇的です。
競合との比較では、GoogleのGemini 3.1 ProやAnthropicのClaude Opus 4.6との比較では勝ち負けがありますが、大きな差ではなく、OpenAIが勢いを取り戻したような印象です。
バリアント:Thinking・Proの違い
GPT-5.4はChatGPTで2つの形態で提供されます。
| バリアント | 特徴 | 対象プラン |
|---|---|---|
| GPT-5.4 Thinking | 推論・長文クエリ対応、思考途中の介入機能あり | Plus・Team・Pro |
| GPT-5.4 Pro | 最高性能版・より深い推論・複雑タスク向け | Pro・Enterprise |
APIでは gpt-5.4(標準)と gpt-5.4-pro(高精度)の2モデルが提供されています。
誰が使えるか:プラン別まとめ
| ChatGPTプラン | GPT-5.4 Thinking | GPT-5.4 Pro |
|---|---|---|
| 無料(Free) | △(会話内容により自動切替の場合あり) | ✕ |
| Plus | ◎(モデルピッカーから手動選択) | ✕ |
| Team | ◎ | ✕ |
| Pro | ◎ | ◎ |
| Enterprise / Edu | ◎(管理者設定で有効化) | ◎ |
API料金(参考)
GPT-5.4の標準版はGPT-5.2と比較して、入力料金が$1.75→$2.50(約43%増)、出力料金が$14.00→$15.00(約7%増)となっています。
また、GitHub Copilot(Pro / Pro+ / Business / Enterprise)でもリリース当日から一般提供が開始されており、Copilot Chatのモデル選択でGPT-5.4を指定できます。
GPT-5.2 Thinkingは廃止される
GPT-5.4のリリースに伴い、GPT-5.2 Thinkingが廃止予定になっています。
GPT-5.2は2026年6月5日に廃止される予定です。APIを利用して自社システムに組み込んでいる場合は、期日までの移行計画を策定する必要があります。
ChatGPTでは、GPT-5.2 Thinkingは2026年6月5日までレガシーモデルとして手動選択が可能です。それまでの間に動作確認・移行を進めるのが安全です。
IT Picks的な所感:使う人にとって何が変わるか
「性能が上がった」という話は毎回ありますが、GPT-5.4で個人的に注目しているのはPC操作(Computer Use)の実用化です。
OSWorld 75%という数字は、「AIが人間と同等以上のPC操作精度を持った」ことを意味します。 今まで「AIに指示して、自分で実行する」だったものが、「AIが自分で実行する」に変わるフェーズが近づいています。
ただ、現時点でComputer Use機能はAPIとCodexプラットフォームが中心で、一般的なChatGPT利用者がすぐ使いこなせる機能とは少し距離があります。 「どう活用するか」を自分で設計できる開発者・業務改善担当者が先に恩恵を受けるフェーズです。
一般ユーザーへの影響としては、ハルシネーション33%減・Mid-Response Steering・100万トークンのコンテキストが実感しやすい変化だと思います。特に「長い資料を読ませて質問する」用途での体験が改善しているはずです。
まとめ
GPT-5.4のポイントをまとめます。
- リリース日:2026年3月5日(日本時間6日)
- 最大の新機能:ネイティブPC操作(OSWorld 75%・人間超え)
- 主な改善:ハルシネーション33%減・100万トークンコンテキスト・思考途中の方向修正
- 使えるプラン:Plus以上(ChatGPT)、APIは即日利用可能
- 注意点:GPT-5.2 Thinkingは2026年6月5日に廃止予定。API利用者は移行計画を
「また新しいモデルが出た」で流してしまいがちですが、今回のPC操作の実用化は中長期的に業務のあり方を変える可能性があります。 まずはChatGPT Plus以上のプランを使っている方は、GPT-5.4 Thinkingに切り替えて使い心地を試してみてください。
