AI Weekly 2025-07-24
Qwen3-Coder と Qwen Code の発表
日付:2025 年 7 月 22 日
Qwen3-Coder が発表。最も強力な Qwn3-Coder-480B-A35B-Instruct は、480B パラメータ、35B active parameters の Mixture-of-Experts (MoE)モデル。256K トークンのコンテキスト長をネイティブサポートし、外挿手法で 1M トークンまで対応。Agentic Coding、Agentic Browser-Use、Agentic Tool-Use でオープンモデル最高性能を達成し、Claude Sonnet 4 と同等の性能。
合わせて Qwen Code も公開。Gemini CLI から派生。Qwen-Coder モデル用に強化されたパーサーとツールサポートを提供。npm 経由で @qwen-code/qwen-code
としてインストール可能。OpenAI SDK をサポートし、Claude Code や Cline との互換性も備える。Alibaba Cloud DashScope を通じて API アクセスも提供。
Gemini 2.5 Flash-Lite 安定版リリース
日付:2025 年 7 月 22 日
Gemini 2.5 Flash-Lite の安定版が一般公開。Gemini 2.5 ファミリーで最も高速かつ低コストなモデル。入力 $0.10/1M
トークン、出力 $0.40/1M
トークンで pricing を設定。1M トークンのコンテキストウィンドウをサポートし、native reasoning capabilities を搭載。
Gemini 2.0 Flash-Lite より高速で、音声入力価格を 40% 削減。Grounding with Google Search、Code Execution、URL Context などの native tools をサポート。実用例では Satlyt で 45% のレイテンシ削減と 30% の消費電力削減を実現。Google AI Studio と Vertex AI で利用可能。
出展:Gemini 2.5 Flash-Lite is now stable and generally available
Gemini 2.5 会話型画像セグメンテーションの紹介
日付:2025 年 7 月 21 日
Gemini 2.5 で会話型画像セグメンテーション機能を発表。従来の単語ラベルから複雑な記述的フレーズの解析に進化。「最も遠くにある車」「傘を持っている人」など自然言語クエリで画像の特定領域を抽出可能。
オブジェクト関係、条件ロジック、抽象概念、画像内テキスト、多言語ラベルの 5 つのクエリタイプをサポート。メディア編集、安全監視、保険査定などの実用例を提示。gemini-2.5-flash モデルで単一 API による利用が可能。
Veo 3 が Gemini API で利用可能に
日付:2025 年 7 月 17 日
Veo 3 が Gemini API と Vertex AI で有料プレビューとして利用可能に。Text-to-Video 機能を提供し、近日中に Image-to-Video 機能も追加予定。
ネイティブ音声生成、映画品質の高精細動画、リアルな物理シミュレーションが特徴。価格は $0.75/秒。Cartwheel の 3D アニメーション変換、Volley の RPG ゲームカットシーン制作などの実用例。SynthID デジタル透かし付きで責任ある開発をサポート。
Cursor Bugbot 正式リリース
日付:2025 年 7 月 24 日
Cursor の PR 自動コードレビューエージェント Bugbot がベータ版を終了し正式リリース。ロジックバグ、エッジケース、セキュリティ問題を本番環境前に検出。PR 内で問題発見箇所に直接コメントし、ワンクリックで Cursor や Web エージェントに送信可能。
ベータ期間中に 100 万 PR 以上をレビューし、150 万以上の問題を発見。特定されたバグの 50% 以上が PR マージ時に解決済み。BUGBOT.md
によるカスタムルール設定で各コードベースに最適化。2 週間無料期間後、月額 $40 で利用可能。
GitHub Spark パブリックプレビュー開始
日付:2025 年 7 月 23 日
GitHub Spark が Copilot Pro+ 加入者向けにパブリックプレビューとして利用可能に。自然言語を使ってアイデアからフルスタック知能アプリまで数分で作成可能。Claude Sonnet 4 を使用してフロントエンド・バックエンド機能を含むアプリを生成。
セットアップ不要でデータ、LLM 推論、ホスティング、展開、GitHub 認証がすべて含まれる。OpenAI、Meta、DeepSeek、xAI などの LLM を API キー管理なしで利用でき、ワンクリック展開を実現。github.com/spark からアクセス可能。
出展:GitHub Spark in public preview for Copilot Pro+ subscribers
GitHub Copilot coding agent で複数の instructions ファイルを利用可能に
日付:2025 年 7 月 23 日
GitHub Copilot coding agent が *.instructions.md
カスタム指示をサポート。従来の .github/copilot-instructions.md
に加えて、.github/instructions
フォルダ内の複数ファイルに対応。YAML frontmatter により特定のファイルやディレクトリに適用範囲を指定可能。
出展:GitHub Copilot coding agent now supports .instructions.md custom instructions
Claude Code カスタムサブエージェント機能追加
日付:2025 年 7 月 24 日
Anthropic が Claude Code でカスタムサブエージェント機能を発表。特定タスク専用の AI アシスタントを作成可能で、独自のコンテキストウィンドウとカスタムシステムプロンプトを持つ。各サブエージェントは特定ツールへのアクセス制限が可能で、メインの会話と分離された専門的な作業を実行。
.claude/agents/
または ~/.claude/agents/
での Markdown ファイル管理で、YAML frontmatter による設定。/agents
コマンドでの管理インターフェースを提供。
出展:[Claude Code is getting a brand new feature: custom subagents - Sid on X]https://x.com/sidbidasaria/status/1948495478146167251