Claude Opus 4.6・Sonnet 4.6、100万トークンcontextを一般提供
Claude Platform で Opus 4.6 と Sonnet 4.6 向けに、100万トークンの context window が一般提供(GA)へ移行。従来どおりの標準単価が窓の全長にフラットに適用され、長文脈専用の追加料金(long-context premium)はない。公式の掲げ方では、Opus 4.6 は入力 5ドル・出力 25ドル、Sonnet 4.6 は入力 3ドル・出力 15ドル(いずれも百万トークンあたり)で、900K トークンでも 9K トークンでもトークンあたりの倍率はかからない。
context の長さに応じてレート制限が段階的に狭くなるのではなく、通常アカウントのスループットが窓全体で有効。1リクエストあたりの画像または PDF ページは最大 600 まで(従来 100 から 6 倍)で、Claude Platform に加え Microsoft Foundry と Google Cloud の Vertex AI でも同日提供。200K トークンを超えるリクエストでは beta 用ヘッダーは不要で、既に送っている beta ヘッダーは無視されるため、呼び出し側に強い移行負荷はない。
Claude Code では Max・Team・Enterprise の Opus 4.6 セッションに 1M context が標準で乗り、compaction が減り会話の連続性が保ちやすい位置づけ。1M は以前は追加利用が必要だった、との説明。長文脈での想起・推論の指標として、Opus 4.6 は MRCR v2 で 78.3% とされ、その context 長ではフロンティアモデル中で最高、としている。コードベースや大量ドキュメント、長時間エージェントのトレースを一つの窓に載せる前提の話から、エンジニアリング上の損失的サマリや都度の context クリアへの依存を減らす、という文脈で事例・引用が続く。
主要な変更点
- 標準単価のまま 1M 窓全体を利用可能(長文脈プレミアムなし、トークン単価に窓長による倍率なし)。
- 全 context 長で通常のレート制限が適用。
- 画像・PDF ページの上限を 600 に拡大(Claude Platform、Microsoft Foundry、Vertex AI)。
- 200K 超リクエストは beta ヘッダー不要(既存ヘッダーは無視)。
- Claude Code の Max・Team・Enterprise で Opus 4.6 に 1M context を標準搭載。
留意事項
提供経路(Claude Platform ネイティブ、Amazon Bedrock、Vertex AI、Microsoft Foundry)ごとの細目・制限は、公式の context window と pricing の記述に従う。