Codex、文脈取得と Goal モード、ブラウザ改善

1068文字
5分
編集

Codex は 2026-05-21、作業中の画面文脈を渡しやすくし、長時間タスクを Goal で継続し、フロントエンド検証をブラウザ上で細かく指示し、Mac ロック後も限定的に Computer Use を続けられる更新をまとめて公開した。

#Appshots(macOS Codex アプリ)

Appshots は、前面のアプリウィンドウをホットキーで Codex スレッドに添付する機能である。可視領域のスクリーンショットと、そのウィンドウから取得可能なテキスト(スクロール外でアプリが公開しているテキストを含む)を送れる。手動でファイルを添付した場合と同様にセッションファイルへローカル保存される。

  • 既定のホットキーは両方の Command キー。Codex 設定で変更可能
  • 直近 60 秒以内に Codex スレッドを操作していた場合は新規スレッドではなくそのスレッドへ追加する。連続撮影は同一スレッドに蓄積する
  • 初回は macOS の Screen & System Audio Recording と Accessibility の許可が必要
  • Google Docs、Gmail、Sheets、Slides など一部アプリでは可視スクリーンショットのみで全文が取れない場合がある。対応プラグインがあればプラグイン経由で内容にアクセスできる
  • CLI は既存スレッド内の Appshots 履歴を参照できるが、新規 Appshots の作成は macOS 用 Codex アプリのみ

#Goal モード(アプリ・IDE 拡張・CLI)

Goal モードは、完了条件付きの目的をスレッド横断で保持し、多段階タスクの完了判定に使う。2026-05-21 時点でアプリ、IDE 拡張、CLI 全体で一般提供となった。/goal で開始し、目標文が最初のプロンプトと完了基準の両方になる。

  • スラッシュコマンド一覧に /goal が無い場合は config.toml[features]goals = true を有効化する。CLI では codex features enable goals でも有効化できる
  • Codex アプリではコンポーザ上に進捗が表示され、一時停止・再開・編集・クリアができる
  • 成功基準は測定可能な条件(strict TypeScript への移行完了、TTI 1 秒未満など)で書くと判定しやすい。定義が曖昧なときは /plan やインタビューで Goal を整形してから実装に入る

#インナーブラウザのスタイル注釈

ページ注釈(Annotation mode)で要素や領域を選んだあと、テキスト入力横の設定アイコンからフォント・テキスト・余白・色などのスタイル値を対話的に調整できる。ページ上でプレビューしたうえで注釈を送るため、レイアウト修正の指示が具体化する。ブラウザベースやフロントエンド作業向けの改善として位置づけられる。

#ロック中 Computer Use(macOS)

Locked computer use は、Mac の画面ロック後も、接続済み端末から開始した Computer Use タスクがデスクトップアプリ操作を続けられる仕組みである。Windows では Computer Use は前面操作のみで、ロック後の同等機能はない。

  • Codex 設定の Computer Use で有効化する。有効化時に Apple の authorization plug-in がインストールされ、macOS のアンロックフローに参加する
  • 一般用途のリモートアンロック経路ではなく、Codex のアクティブな Computer Use ターンに限定される
  • ロック後のアプリアクセス時は、信頼済みターンかを確認したうえで短時間だけアンロックし、全ディスプレイを覆い、ローカルのキーボード・ポインタ入力を検知すると再ロックして手動アンロックを求める
  • Computer Use 自体の地域制約(欧州経済領域・英国・スイスでの提供制限など)は従来どおり適用される

#ブラウザ操作のその他改善

同一リリースでは Browser use 周辺も更新されている。高度な注釈モード、ページアセット抽出の高速化、読み取り専用のページ検査用 JavaScript、タブグループの操作性、Codex Chrome 拡張のタブ煩雑さの低減、信頼性の改善が挙げられている。Browser use は Browser プラグインを有効化し、@Browser またはブラウザ利用の指示で、ログイン不要なローカル開発サーバーやファイルプレビューをインナーブラウザ内で操作する。

#管理者向け requirements.toml

ChatGPT Business / Enterprise では、管理者が requirements.toml でセキュリティ関連設定を上書きでき、クラウド取得の要件と併用できる。[features] では config.toml と同じキーで機能フラグを固定でき、features.in_app_browserfeatures.browser_usefeatures.computer_usefalse にするとインナーブラウザペイン、Browser Use、Computer Use の利用を無効化できる。

#参考文献