AI Weekly 2025-08-07 - hrdtbs' blog

GoogleのコーディングエージェントJulesが一般公開#

日付：2025年8月6日

Googleの非同期コーディングエージェントJulesが、ベータ版を終了し一般公開された。Gemini 2.5 Proを搭載し、コーディングプランを策定することで、より高品質なコード出力を実現する。

ベータ期間中のフィードバックに基づき、UIの改善、数百件のバグ修正に加え、以下の新機能が追加された。

以前のセットアップを再利用し、新しいタスクを高速化する機能
GitHub issuesとの連携
マルチモーダルサポート

また、Google AI ProおよびUltraのサブスクライバー向けに、利用上限を引き上げた新しい構造化プランが導入される。

Introductory access: 試用プラン。15件/日のタスク、3の同時タスク、Gemini 2.5 Proを搭載。
Jules in Google AI Pro: 100件/日のタスク、15の同時タスク、Gemini 2.5 Proに加えて最新モデルへのアクセス。
Jules in Google AI Ultra: 300件/日のタスク、60の同時タスク、Gemini 2.5 Proに加えて最新モデルへの優先アクセス。

セキュリティに懸念があるDevinなどと比較し、かなり安全な設計に倒されているため、プライベートモジュールなど環境変数の設定が必要なリポジトリの利用でつまづくユーザーが多い可能性がある。Codebase毎にinitial scriptを記述することで対処できるが、分かりやすいとは言えない。

出展：Jules is now available for everyone

OpenAI、GPT-5リリース#

日付：2025年8月7日

OpenAIは、同社で最も高性能、高速、汎用性を備えたフラッグシップモデル「GPT-5」をリリース。推論とチャットを単一のシステムに統合。全ユーザーが利用可能となり、有料ユーザーは利用制限が引き上げられる。上限に達するとGPT-5 miniに切り替わる。Pro登録者は利用制限が緩和され、拡張推論機能を備えた「GPT-5 Pro」にもアクセス可能になる。

出展：GPT-5 のご紹介

Claude Opus 4.1がリリース#

日付：2025年8月6日

Claude Opus 4のアップグレード版であるClaude Opus 4.1がリリースされた。このモデルは、エージェントタスク、実世界でのコーディング、および推論能力が向上している。SWE-bench Verifiedにおけるコーディング性能は74.5%に達し、詳細なリサーチやデータ分析スキル、特に詳細追跡とエージェント検索の能力が改善された。

本モデルは有料のClaudeユーザー、Claude Code、API、Amazon Bedrock、Google CloudのVertex AIで利用可能。価格はClaude Opus 4から据え置き。GitHubからは、特に複数ファイルにまたがるコードのリファクタリング性能が向上したと評価されている。開発者がAPI経由で利用する場合、モデル名としてclaude-opus-4-1-20250805を使用する。

出展：Claude Opus 4.1 - Anthropic

Claude Code、自動セキュリティレビュー機能を追加#

日付：2025年8月6日

Claude Codeに、コードのセキュリティレビューを自動化する機能が追加された。GitHub Actionsとの連携や、新しい/security-reviewコマンドを使用して、開発者はコードの脆弱性を特定し、修正を依頼できる。これにより、脆弱性がproduction環境に到達する前に発見し、対処することが可能になる。

/security-review コマンド: ターミナルからアドホックにセキュリティ分析を実行。SQL injectionやcross-site scripting (XSS)などの一般的な脆弱性パターンを検索し、発見された問題の詳細な説明を提供する。
GitHub Actions 連携: 新規pull requestが開かれると自動的にトリガーされ、コードの変更点をレビュー。カスタマイズ可能なルールを適用し、懸念事項を修正案とともにpull requestへインラインでコメントする。

この機能はAnthropic社内でも利用されており、DNS rebindingによるリモートコード実行の脆弱性や、SSRF (Server-Side Request Forgery)攻撃の脆弱性をリリース前に発見、修正した実績がある。両機能はすべてのClaude Codeユーザーが利用可能。

出展：Automate security reviews with Claude Code - Anthropic

Vercel MCPサーバーがパブリックベータで公開#

日付：2025年8月6日

Vercelが公式のVercel MCPサーバーをパブリックベータとして公開。Vercel MCPは、AIクライアントがVercelプロジェクトと安全に対話するための、OAuth準拠のセキュアなインターフェース。CursorやClaudeなどのサポートされたAIツールが、開発環境やAIアシスタント内から直接、Vercelのログ、ドキュメント、プロジェクトメタデータにアクセス可能になる。

Vercel MCPで定義されたツールにより、以下の操作が可能。

Vercelドキュメントの検索：「BotIDの設定方法は？」といった質問に対し、公式ドキュメントから回答を取得。
デプロイメントログの取得：デプロイ失敗時に、AIアシスタントが関連ログを取得し、エラー分析や修正案の提示を行う。
チームの取得：アカウントにリンクされた全チームのリストを取得。
プロジェクトの取得：認証されたプロジェクトを取得。

接続は、公開エンドポイント https://mcp.vercel.com をカスタム接続として追加することで行う。セキュリティ対策として、サーバーは初期段階では読み取り専用であり、承認されたクライアントのallowlistを維持し、接続ごとにOAuth同意画面を要求する。今後のロードマップには、より多くのクライアントのサポートや、読み取り専用機能を超えた機能拡張が含まれている。

出展：Introducing Vercel MCP: Connect Vercel to your AI tools

Cursor v1.4、ファイルの読み取り上限廃止やGitHub連携#

日付：2025年8月6日

Cursor v1.4がリリース。エージェント機能の改善が行われた。

ファイルの読み取りの2MB上限が廃止。ファイル全体を読み取れるように。
ファイルのメタデータを利用し完全なディレクトリツリーの探索が可能に。
タブやエディタ毎に異なるモデルを割り当てられることが可能に。
表示をシンプルにするコンパクトチャットモードの追加。設定から切り替える可能。
バックグラウンドエージェントをGitHubのPRから直接使用可能に。@Cursorタグを付けることで利用できる。
フォアグラウンドとバックグラウンドの両方のエージェントを左サイドバーで管理できるように。

出展：Changelog - Aug 6, 2025 | Cursor

Cursor AgentがCLIで利用可能に#

日付：2025年8月7日

Cursor Agentが、コマンドラインインターフェース（CLI）またはヘッドレス環境で利用可能になった。これにより、NeovimやJetBrainsなどの他のIDEを使用している開発者もCursor Agentの全機能を利用できる。CLIはCursorのサブスクリプションに含まれる任意のモデルで動作し、ターミナルやリモート環境で複数のエージェントを並行して実行することも可能。

利用を開始するには、次のコマンドを実行する。

1
# インストール
2
curl https://cursor.com/install -fsSL | bash
3

4
# プロンプトを指定してCLIを開始
5
cursor-agent chat "find one bug and fix it"

このCLIは現在ベータ版。セキュリティ保護は開発途上であり、ファイルの読み取り、変更、削除、およびユーザーが承認したシェルコマンドの実行が可能。信頼できる環境でのみ自己責任で使用する必要がある。

出展：Cursor Agent CLI | Cursor

参考：Cursor CLI | Cursor - Overview

CursorでOpenAIの最新モデル「GPT-5」が1週間無料で利用可能#

日付：2025年8月7日

AI搭載コードエディタのCursorで、OpenAIの最新モデルであるGPT-5が利用可能になった。Cursor開発チームによると、同モデルはコーディングにおいて非常に効果的であるという。

Cursorのエンジニアチームによる初期の所感は以下の通り。

長時間実行される複雑なタスクに適している。
指示を具体的にすることで、モデルの能力を最大限に引き出せる。
他のモデルでは解決が困難だった複雑なバグの修正に成功した事例がある。
出力スタイルや対話の振る舞いをユーザーの好みに合わせて調整できる。
モノレポ環境で、バックエンドAPIとフロントエンドのReactコンポーネントを一度の指示で正確に生成可能。

有料ユーザーは、ローンチ週に限り（8月14日まで）無料クレジットでGPT-5を試すことができる。

出展：GPT-5 is now available in Cursor

Gemini CLI GitHub Actionsがベータ版としてリリース#

日付：2025年8月6日

リポジトリ向けのAIコーディングアシスタント「Gemini CLI GitHub Actions」がベータ版としてリリースされた。このツールは、GitHubリポジトリ上でコーディングの定型タスクを自動化するエージェント、およびオンデマンドでタスクを委任できるコラボレーターとして機能する。利用は無料。

主な利用例は以下の通り。

Intelligent issue triage: 新しいissueを分析し、ラベル付けや優先順位付けを自動化する。
Accelerated pull request reviews: pull requestの品質、スタイル、正確性をレビューし、フィードバックを即座に提供する。
On-demand collaboration: issueやpull requestで「@gemini-cli」とメンションすることで、テスト作成やバグ修正などのタスクを委任できる。

セキュリティ機能として、Google CloudのWorkload Identity Federation (WIF) を利用したクレデンシャルレス認証や、実行可能なコマンドを制限する許可リスト機能を搭載。また、OpenTelemetryとの統合により、すべてのアクションをリアルタイムで監視可能。

本機能は、Google AI Studioの無料枠内で利用できるほか、Vertex AI、Gemini Code AssistのStandardおよびEnterpriseティアもサポートしている。

出展：Meet your new AI coding teammate: Gemini CLI GitHub Actions

リポジトリ：google-github-actions/run-gemini-cli

OpenAI、オープンウェイトの推論モデル「gpt-oss-120b」と「gpt-oss-20b」をリリース#

日付：2025年8月5日

OpenAIは、Apache 2.0ライセンスの下で利用可能な2つのオープンウェイト言語モデル「gpt-oss-120b」と「gpt-oss-20b」をリリースした。これらのモデルは、推論タスク、ツール使用、few-shotの関数呼び出しにおいて高いパフォーマンスを発揮し、一般的なハードウェア上での効率的な展開のために最適化されている。

gpt-oss-120b:
- 117Bのパラメータを持つモデル。
- 単一の80GB GPUで効率的に稼働し、コア推論ベンチマークでOpenAI o4-miniとほぼ同等の結果を達成。
gpt-oss-20b:
- 21Bのパラメータを持つモデル。
- 16GBのメモリを搭載したエッジデバイスで実行可能。
- 一般的なベンチマークでOpenAI o3‑miniと同様の結果を達成。
共通の特徴:
- Responses APIと互換性があり、指示追従、Web検索、Pythonコード実行などのツール使用が可能。
- 思考の連鎖（CoT）を完全に提供し、Structured Outputをサポート。
- 安全性トレーニングと評価を経ており、フロンティアモデルと同等の安全基準を提供する。

両モデルは、mixture-of-experts（MoE）を活用したTransformerアーキテクチャを採用している。推論とメモリ効率向上のため、グループ化されたマルチクエリアテンションを使用し、最大128kのコンテキスト長をネイティブにサポートする。トークナイザーには、o200k_harmonyが使用され、こちらもオープンソース化された。

出展：Introducing gpt-oss

VS Code v1.103リリース#

日付：2025年8月7日

VS Code v1.103がリリース。GPT-5のサポートやMCP体験の改善、Git worktreeのサポート、コーディングエージェントのセッション管理用ビューの追加など。

出展：Visual Studio Code July 2025

GPT-5およびGPT-5 miniのサポート#

OpenAIの最新モデルであるGPT-5とGPT-5 miniがGitHub Copilotで利用可能になった。GPT-5は、有料のGitHub Copilotプランで利用でき、推論、コーディング、チャットにおいて新たな進歩を提供する。GPT-5 miniは、より高速でコスト効率の高いモデルとして、全てのGitHub Copilotプランに展開。

GPT-5はプレミアムリクエストを1、GPT-5 miniは0.33消費する。

チャットセッションの復元#

チャットの会話とワークスペースの変更を特定時点の状態に復元できる機能が追加。チャット欄の”Restore checkpoint”から復元できる。

エージェントの進捗を可視化するタスクリスト#

エージェントがタスクを細分化して実行する際の進捗を、チャットビュー上部のリストで追跡できる実験的機能が追加。 chat.todoListTool.enabledで有効化。

Gitワークツリーのサポート#

Gitワークツリーのサポートを追加。ワークツリーを使用すると、複数のブランチを一度にチェックアウトできるため、コンテキストを切り替えることなく変更をテストしたり、並行して作業したりすることが容易になる。特にAIエージェントを利用した並列開発で最近は注目されている。

Gitリポジトリを含むフォルダまたはワークスペースを開くと、ワークツリーが自動的に検出され、ソース管理リポジトリビューに表示されるようになった。コマンドパレットまたはソース管理リポジトリビューから利用可能なコマンドを使用して、新しいウィンドウまたは現在のウィンドウでワークツリーを表示、作成、削除、開くことも可能。

Chat sessions#

コーディングエージェントのセッションを専用のチャットエディタで管理する実験的機能。エージェントの進捗確認や追加指示を専用UIから行える。 chat.agentSessionsViewLocationで有効化。

#copilotCodingAgentツールまたはUI controlsからコーディングエージェントセッションを開始すると、付属のチャットエディターでエージェントのコーディングの進行状況を確認、追加指示が出来る。

またchat.agentSessionsViewLocationを有効化と、VS Codeのサイドバーにチャットセッションビューが表示される。

ComfyUI、複雑なワークフローを効率化するサブグラフ機能を公式リリース#

日付：2025年8月7日

ComfyUIにサブグラフ機能が公式にリリースされた。この機能により、関連する複数のノードを単一の再利用可能なノードにまとめることが可能になる。複雑なワークフローを、シンプルで管理しやすいモジュール部品のように構築できる。

サブグラフ機能:
- 選択したノード群を、完全なInput/Outputを持つ一つのパッケージに変換
- 単一の「スーパーノード」として機能
- 内部を編集するための編集モードを提供
- 再利用可能なモジュールとして、コピー＆ペーストで流用可能

サブグラフの作成は、対象ノードを選択し、選択ツールボックスの「Subgraph」ボタンをクリックするだけで完了する。ノードのアイコンをクリックすると編集モードに入り、外部とデータをやり取りするためのInput/Outputスロットに接続できる。

また、ワークフローの一部だけを実行してテストできるPartial Execution機能も追加された。これにより、イテレーションの高速化が期待される。

出展：Subgraph Official Release! Making Complex Workflows Clean and Efficient

参考：