GPT-5.5
OpenAI は GPT-5.5 および高負荷向けの GPT-5.5 Pro を公開した。実務向けのエージェント的な作業(コーディング、調査、文書化、表計算、ツール連携、長時間のタスク完遂)を、より少ない指示で進め、ツール使用や自己点検の精度を上げる方向で設計している。従来モデル比で高い知性を維持しつつ、サービングでは GPT-5.5 が GPT-5.4 並みの遅延で応答し、同じ Codex 作業をより少ないトークンで終えられるとしている。
- ChatGPT: GPT-5.5(Thinking)を Plus / Pro / Business / Enterprise へ。GPT-5.5 Pro は Pro / Business / Enterprise 向け
- Codex: Plus / Pro / Business / Enterprise / Edu / Go で提供し、40 万トークンコンテキスト。Fast モードは 1.5 倍速でトークン単価は 2.5 倍
- API: 近日、Responses / Chat Completions 向けに
gpt-5.5を入力 100 万トークン当たり 5 ドル・出力 30 ドル、コンテキスト 100 万トークンで提供し、gpt-5.5-proは入力 30 ドル・出力 180 ドル。バッチと Flex は標準料金の半額、Priority は 2.5 倍
セキュリティ面では、デプロイ前の安全評価、Preparedness Framework、サイバーと生物学の上級能力向けの重点レッドチーミング、リリース前の約 200 社パートナーからの利用フィードバックを実施したとしている。GPT-5.5 Pro は同一基盤モデルの並列テスト時計算モードとみなされ、系統外評価が必要なケースを除きオフライン設定での結果を主に記載する。より細かな評価値は System Card にまとまっている。サイバー能力と生化学系の扱いは Preparedness 上の「High」扱いとし、GPT-5.2 から積み上げてきた誤用制限用クラスファイアをさらに厳格化している。
評価(ベンダー)
エージェント的コーディングでは SWE-Bench Pro(公開子集合)で 58.6%、Terminal-Bench 2.0 で 82.7%(比較として示された GPT-5.4 は 75.1%)、知識労働系の GDPval で 84.9% などの数値が公表されている。
API 価格の比較
| モデル | 入力 ($/1M) | 出力 ($/1M) |
|---|---|---|
| gpt-5.5 | 5.00 | 30.00 |
| gpt-5.4 | 2.50 | 15.00 |
| gpt-5.5-pro | 30.00 | 180.00 |
gpt-5.5 は gpt-5.4 より従量単価は高い一方、多くのワークロードでトークン数を減らせるため実コストの上下は利用形態に依存しやすい。gpt-5.5-pro は最高精度帯向けの割高な単価設定である。