AI Weekly 2025-06-19
Cursor 1.1 リリース、Background Agents in Slack
日付:2025 年 6 月 12 日
Cursor の Background Agents を Slack から直接起動可能な機能を追加。Slack で@Cursor をメンションすることで、エージェントがスレッドを読み取り、状況を理解して GitHub で PR を作成する一連の作業を会話を離れることなく実行可能。
エージェントはリモートの安全な環境で動作し、作業完了時に Cursor と GitHub へのリンクを含む更新を Slack で直接受信。Cursor はエージェント開始前に Slack スレッド全体を読み取るため、以前の議論や問題への参照時に完全なコンテキストを理解。
利用にはワークスペース管理者による Slack 統合の設定が必要。接続後、任意のチャンネルで@Cursor とプロンプトを記述して利用可能。help コマンドで全コマンド確認、settings コマンドでデフォルトモデル、リポジトリ、ブランチの設定が可能。
その他の改善点として、設定内での Cmd/Ctrl+F 検索機能、MCP サーバーからのプログレス通知、動的ツール登録、Roots サポート、ワークスペースインデックス問題の修正、クライアントサイドパフォーマンス向上が含まれる。
出展:Cursor 1.1
Gemini 2.5 モデルファミリーアップデート
日付:2025 年 6 月 17 日
Google が Gemini 2.5 モデルファミリー全体にわたるアップデートを発表。Gemini 2.5 Pro と Gemini 2.5 Flash が一般提供開始、新たに Gemini 2.5 Flash-Lite をプレビューで提供開始。
すべてのモデルが thinking models で、回答前に思考プロセスを経ることで性能向上と精度改善を実現。開発者は「thinking budget」を制御し、モデルがどの程度「考える」かを選択可能。
Gemini 2.5 Flash-Lite は最低レイテンシと最低コストを実現。1.5 および 2.0 Flash モデルからのコスト効率的なアップグレードとして設計。高スループットタスクに最適で、デフォルトで thinking 機能はオフ。
価格が更新され、Gemini 2.5 Flash の入力トークン価格が$0.30/1M
(従来$0.15
から上昇)、出力トークン価格が$2.50/1M
(従来$3.50
から下降)。thinking/non-thinking の価格差を撤廃。
Devin で GitHub ユーザー名を使用した PR 作成が可能に
日付:2025 年 6 月 11 日
Devin が開発者の GitHub ユーザー名を使用して PR を作成する機能を追加。この機能はデフォルトでオフに設定されており、GitHub の Integrations ページにある「PR Author」から選択可能。
設定は組織の全メンバーに適用され、管理者のみ変更可能。従来は Devin の名前で PR が作成されていたが、この機能により開発者自身の名前で PR を作成することが可能。
Claude Code がリモート MCP サーバーサポートを提供開始
日付:2025 年 6 月 18 日
Anthropic が Claude Code でリモートサーバーサポートを発表。ローカルサーバー管理なしでお気に入りのツールやデータソースに接続可能。
Claude Code は開発ツール、プロジェクト管理システム、ナレッジベースなどのサードパーティサービスからコンテキストを取得し、それらのサービス内でアクションを実行可能。Sentry MCP サーバーとの統合でエラーや問題へのアクセス、Linear MCP サーバーとの統合でアクティブプロジェクトのコンテキスト活用が可能。
リモート MCP サーバーはローカルサーバーに比べて保守負担が軽く、ベンダーの URL を Claude Code に追加するだけで利用可能。ベンダーがアップデート、スケーリング、可用性を管理。ネイティブ OAuth サポートで既存アカウントへの安全な接続を実現。
出展:Remote MCP support in Claude Code
参考:Model Context Protocol (MCP) - Authropic#Authenticate with remote MCP servers
OpenAI が Agents SDK を利用したデモを公開
日付:2025 年 6 月 19 日
OpenAI が次の 3 つの Agents SDK を利用したデモを公開。
-
Customer Service Agents Demo:
- OpenAI Agents SDK を使用した航空会社カスタマーサービス向けエージェントシステム。Triage Agent、Seat Booking Agent、Flight Status Agent、FAQ Agent、Cancellation Agent で構成。Python バックエンドと Next.js UI で実装
- リポジトリ:openai-cs-agents-demo
-
Testing Agent Demo:
- OpenAI CUA model と Responses API を使用した UI テスト自動化エージェント。Web アプリの自動テストを実行し、frontend、cua-server、sample-test-app の 3 コンポーネントで構成
- リポジトリ:openai-testing-agent-demo
-
Responses Starter App:
- MCP(Model Context Protocol)と code interpreter ツールをサポートするスターターアプリ。responses 機能と built-in ツールを使った開発の出発点として活用可能
- リポジトリ:openai-responses-starter-app
OpenHands CLI がターミナル向け AI 開発エージェントとして発表
日付:2025 年 6 月 17 日
OpenHands がターミナルから直接利用可能な CLI を発表。ソフトウェア開発エージェントをターミナルから簡単に使用可能。
インストールはpip install openhands-ai
とopenhands
コマンドで完了。Docker 不要で Web インターフェースも不要。Python 3.12 または 3.13 が必要。uvx を使用した実行も対応。
完全オープンソース(MIT ライセンス)でモデル非依存。Claude 4 sonnet で最高性能を発揮し、ローカルモデルの Devstral も利用可能。SWE-Bench Verified で世界トップクラスの性能を記録。
主要機能はスラッシュコマンド(/init
でリポジトリ探索とドキュメント作成)、セキュリティ向上のための確認モード、新機能追加・バグ修正・テスト追加・リファクタリング・ドキュメント作成・コード説明に対応。
出展:The OpenHands CLI: AI-Powered Development in Your Terminal
GitHub Copilot の月次プレミアムリクエスト割り当てが施行開始
日付:2025 年 6 月 18 日
GitHub Copilot の有料プランユーザーに対する月次プレミアムリクエスト割り当てが施行開始。Copilot Pro、Pro+、Business、Enterprise プランでプレミアムリクエストの月次割り当てが強制適用される。
プレミアムリクエストは追加 AI モデルと機能の利用に使用され、モデルによって使用量が異なる。従来通り GPT-4.1 と GPT-4o のエージェントモードとチャット相互作用、無制限コード補完は継続提供。
月次割り当ては毎月 1 日にリセット。割り当て超過時は Pay-Per-Request オプションで課金設定から支払い制限を設定可能(デフォルト$0)。IDE の Copilot ステータスアイコンからリアルタイム使用量監視と詳細レポートダウンロードが可能。
MiniMax-M1 が公開、100 万トークンのコンテキストウィンドウ
日付:2025 年 6 月 16 日
中国 MiniMax が大規模言語モデル MiniMax-M1 をオープンソース化。非常に長いコンテキストウィンドウ(入力 100 万トークン・出力 8 万トークン)を持つハイブリッド Mixture-of-Experts 推論モデル。
合計 4560 億パラメータで、トークンごとに 459 億パラメータがアクティブ。Lightning Attention メカニズムにより、DeepSeek R1 と比較して 10 万トークンコンテキストで 25%の FLOP しか消費せず、テスト時計算を効率的にスケーリング。
競技レベルの数学、コーディング、ソフトウェアエンジニアリング、エージェントツール使用、長文理解タスクで主要商用 AI モデルに匹敵する性能を発揮。SWE-bench Verified で 69.1 を記録。
トレーニング予算はわずか 53 万 4700 ドル(約 7800 万円)。Apache 2.0 ライセンスで GitHub と Hugging Face から利用可能。vLLM と Transformers での実装をサポート。
出展:MiniMax-M1