Claude Fable 5のアクセス停止

米政府は国家安全保障当局に基づく輸出管理指示を出し、米国内外を問わず外国人（Anthropic の外国人従業員を含む）による Claude Fable 5 と Claude Mythos 5 へのアクセスをすべて停止するよう命じた。Anthropic は同日午後 5 時 21 分（東部時間）に指示を受け取り、外国人利用者を個別に判別できないため、法令遵守のため全世界の全顧客向けに両モデルを無効化した。Claude Opus 4.8 など他の Claude モデルへのアクセスは影響を受けない。

指示書には国家安全保障上の懸念の具体的内容は記載されていない。Anthropic の理解では、政府は Fable 5 のセーフガードを迂回するジェイルブレイク手法の存在を把握したと考えている。同社が検証したデモでは、特定のコードベースを読み込ませ欠陥を修正させる手法で、以前から知られていた軽微な脆弱性が少数見つかった程度であり、公開済みの他モデルでも同様の発見が可能だった。政府から口頭で示されたのは、特定コードベースの読み取りと欠陥修正を依頼する狭い非汎用ジェイルブレイクの可能性にとどまる。

Fable 5 公開時に述べた防御方針は次のとおりである。

サイバーセキュリティなど高リスク用途向けに強いセーフガードを設け、誤検知の広さについては利用者からの不満もある水準まで保守的に調整した
公開前に米政府、英国 AISI、複数の第三者組織と社内チームで合計数千時間のレッドチームを実施し、従来展開モデルより実効性が高いと評価した
汎用ジェイルブレイク（広範なサイバー能力を一括で解放する手法）は、いずれのテスターも未発見である
完璧なジェイルブレイク耐性は現状どのプロバイダーでも実現困難と見ており、非汎用ジェイルブレイクの狭さ化と汎用ジェイルブレイクの高コスト化、監視による早期遮断を組み合わせた多層防御を採用した
Mythos クラス向けに顧客データの 30 日間保持を義務化し、ジェイルブレイク調査と緩和に使う

Anthropic は政府の法的指示に従いアクセスを停止する一方、狭い非汎用ジェイルブレイクの可能性だけを理由に数億人規模で展開済みの商用モデルを撤回する基準は妥当ではないと反論している。同基準を業界全体に適用すれば、フロンティアモデルの新規展開は事実上停止すると主張する。政府が示した能力水準は OpenAI の GPT-5.5 など他モデルでも広く得られるもので、防御側の日常業務でも使われているとされる。今後 24 時間以内に詳細を公開する予定である。

利用者への影響と次のアクションは次のとおりである。

停止対象: Claude Fable 5（claude-fable-5）と Claude Mythos 5（claude-mythos-5）
有効時期: 指示受領と同日から即時（全世界の全顧客）
移行先: 当面の代替は案内されていない。同社は誤解であると考え、可能な限り早期の復旧に向けて働いている
影響外: 上記以外の Claude モデルと API

#参考文献