Claude Opus 4.8 - ohiruneuni/blog

Anthropic は最上位モデル Claude Opus 4.8 を公開した。Claude の各製品と Claude API で当日から利用でき、API のモデル識別子は claude-opus-4-8 である。通常利用の従量単価は Opus 4.7 と変わらず、入力は百万トークンあたり 5 ドル、出力は百万トークンあたり 25 ドルである。

Opus 4.7 を基盤にコーディング、エージェント、推論、実務知識の各ベンチで改善が示されている。協業面では判断の鋭さや自己修正、計画への異議、複雑な探索前の確認といった傾向が強まり、生成コードの欠陥を指摘せず通す確率は前版のおよそ四分の一に下がったとされる。アライメント評価でも欺瞞や悪用協力などの不整合行動は Opus 4.7 より大幅に減り、Mythos Preview に近い水準とされる。

既定の effort は high で、claude.ai と Cowork ではモデル選択の横に effort 制御が全プランで使える。高めの設定では思考の頻度と深さが増え、低めでは応答が速くレート制限の消費が抑えられる。Claude Code では xhigh（extra）や max も選べ、難しいタスクや長時間の非同期ワークフロー向けにトークンを多く使う設定が案内されている。Claude Code のレート制限は高 effort 向けに引き上げられた。

fast mode は Opus 4.8 で最大 2.5 倍速で、単価は通常の 2 倍（入力 10 ドル・出力 50 ドル／百万トークン）となり、従来の Opus fast mode より 3 倍安い。

同日の周辺更新は次のとおり。

Messages API が messages 配列内の system エントリを受け付ける。エージェント実行中に権限、トークン予算、環境コンテキストをプロンプトキャッシュを壊さず更新できる。
Claude Code の dynamic workflows（research preview）は、並列サブエージェントで大規模タスクを扱う機能として別途案内されている。

#性能

モデル	Intelligence Index	出力速度 (tok/s)	Artificial Analysis 上の条件
Claude Opus 4.8	56	60.4	Adaptive Reasoning、Max Effort
Claude Opus 4.7	54	50.9	Adaptive Reasoning、Max Effort
GPT-5.5	55	62.5	xhigh

いずれも高 effort 系の測定であり、Opus 4.8 は指数で Opus 4.7 をわずかに上回り GPT-5.5 と同帯に位置するが、出力速度は GPT-5.5 よりやや遅い。

#API 価格の比較

モデル	入力 ($/1M)	出力 ($/1M)
Claude Opus 4.8	5.00	25.00
Claude Opus 4.7	5.00	25.00
GPT-5.5	5.00	30.00
Claude Sonnet 4.6	3.00	15.00

Opus 4.8 は Opus 4.7 と同一の従量単価で、入力単価が同じ GPT-5.5 より出力単価が低い。コストを抑える場合は Sonnet 4.6 が別段の単価になる。

#性能

#API 価格の比較

#参考文献