概要
OpenAIが2026年3月6日、GPT-5.4をChatGPT、API、Codexで一般公開しました。汎用モデルとして初めてネイティブコンピュータ操作機能を搭載し、100万トークンのコンテキストウィンドウで長期タスクの計画・実行・検証に対応します。
出典: OpenAI Release Notes — 2026-03-06
詳細
GPT-5.4はGPT-5.3-Codexの高性能コーディング能力を継承しつつ、以下の新機能を追加しています。
コンピュータ操作
- OSWorld-Verified: 75.0%(人間72.4%を超過)
- WebArena-Verified: 67.3%
- スクリーンショット認識とマウス・キーボード操作を組み合わせた自律的なタスク実行
ツール検索
大規模なツールエコシステムから適切なツールを自動的に発見・選択する「Tool Search」機能を搭載。MCP連携やConnectorsとの相性が向上しました。
知識ワーク
GDPvalベンチマークで83.0%(GPT-5.2は70.9%)を達成。スプレッドシート、プレゼンテーション、ドキュメント作成の精度が大幅に向上。
ポイント
- 100万トークンコンテキストで大規模リポジトリを一度に処理
- 推論トークン効率がGPT-5.2比で大幅改善、コスト削減
- ChatGPTではGPT-5.4 Thinking、APIでは
gpt-5.4として利用可能 - Pro版は
gpt-5.4-proで最高性能を提供
個人開発者への示唆
GPT-5.4の100万トークンコンテキストとコンピュータ操作は、個人開発者にとってゲームチェンジャーです。
従来はコードベースを分割してプロンプトに収める必要がありましたが、プロジェクト全体を渡して「このリポジトリをリファクタリングして」と指示できます。さらにコンピュータ操作により、E2Eテストの実行やデプロイ確認までエージェントに委任できます。
CodexのWindows版も同時リリースされ、macOSユーザー以外も本格的なエージェント開発が可能に。