📰 ニュース2026年3月8日5分で読める

GPT-5.4リリース: ネイティブコンピュータ操作と100万トークンコンテキスト搭載

OpenAIがGPT-5.4を発表。汎用モデルとして初めてネイティブコンピュータ操作機能を搭載し、100万トークンのコンテキストウィンドウで長期タスクに対応。

概要

OpenAIが2026年3月6日、GPT-5.4をChatGPT、API、Codexで一般公開しました。汎用モデルとして初めてネイティブコンピュータ操作機能を搭載し、100万トークンのコンテキストウィンドウで長期タスクの計画・実行・検証に対応します。

出典: OpenAI Release Notes — 2026-03-06

詳細

GPT-5.4はGPT-5.3-Codexの高性能コーディング能力を継承しつつ、以下の新機能を追加しています。

コンピュータ操作

  • OSWorld-Verified: 75.0%(人間72.4%を超過)
  • WebArena-Verified: 67.3%
  • スクリーンショット認識とマウス・キーボード操作を組み合わせた自律的なタスク実行

ツール検索

大規模なツールエコシステムから適切なツールを自動的に発見・選択する「Tool Search」機能を搭載。MCP連携やConnectorsとの相性が向上しました。

知識ワーク

GDPvalベンチマークで83.0%(GPT-5.2は70.9%)を達成。スプレッドシート、プレゼンテーション、ドキュメント作成の精度が大幅に向上。

ポイント

  • 100万トークンコンテキストで大規模リポジトリを一度に処理
  • 推論トークン効率がGPT-5.2比で大幅改善、コスト削減
  • ChatGPTではGPT-5.4 Thinking、APIではgpt-5.4として利用可能
  • Pro版はgpt-5.4-proで最高性能を提供

個人開発者への示唆

GPT-5.4の100万トークンコンテキストとコンピュータ操作は、個人開発者にとってゲームチェンジャーです。

従来はコードベースを分割してプロンプトに収める必要がありましたが、プロジェクト全体を渡して「このリポジトリをリファクタリングして」と指示できます。さらにコンピュータ操作により、E2Eテストの実行やデプロイ確認までエージェントに委任できます。

CodexのWindows版も同時リリースされ、macOSユーザー以外も本格的なエージェント開発が可能に。