AI Weekly 2025-06-19 - hrdtbs' blog

Cursor 1.1 リリース、Background Agents in Slack#

日付：2025 年 6 月 12 日

Cursor の Background Agents を Slack から直接起動可能な機能を追加。Slack で@Cursor をメンションすることで、エージェントがスレッドを読み取り、状況を理解して GitHub で PR を作成する一連の作業を会話を離れることなく実行可能。

エージェントはリモートの安全な環境で動作し、作業完了時に Cursor と GitHub へのリンクを含む更新を Slack で直接受信。Cursor はエージェント開始前に Slack スレッド全体を読み取るため、以前の議論や問題への参照時に完全なコンテキストを理解。

利用にはワークスペース管理者による Slack 統合の設定が必要。接続後、任意のチャンネルで@Cursor とプロンプトを記述して利用可能。help コマンドで全コマンド確認、settings コマンドでデフォルトモデル、リポジトリ、ブランチの設定が可能。

その他の改善点として、設定内での Cmd/Ctrl+F 検索機能、MCP サーバーからのプログレス通知、動的ツール登録、Roots サポート、ワークスペースインデックス問題の修正、クライアントサイドパフォーマンス向上が含まれる。

出展：Cursor 1.1

Gemini 2.5 モデルファミリーアップデート#

日付：2025 年 6 月 17 日

Google が Gemini 2.5 モデルファミリー全体にわたるアップデートを発表。Gemini 2.5 Pro と Gemini 2.5 Flash が一般提供開始、新たに Gemini 2.5 Flash-Lite をプレビューで提供開始。

すべてのモデルが thinking models で、回答前に思考プロセスを経ることで性能向上と精度改善を実現。開発者は「thinking budget」を制御し、モデルがどの程度「考える」かを選択可能。

Gemini 2.5 Flash-Lite は最低レイテンシと最低コストを実現。1.5 および 2.0 Flash モデルからのコスト効率的なアップグレードとして設計。高スループットタスクに最適で、デフォルトで thinking 機能はオフ。

価格が更新され、Gemini 2.5 Flash の入力トークン価格が$0.30/1M（従来$0.15から上昇）、出力トークン価格が$2.50/1M（従来$3.50から下降）。thinking/non-thinking の価格差を撤廃。

出展：Gemini 2.5: Updates to our family of thinking models

Devin で GitHub ユーザー名を使用した PR 作成が可能に#

日付：2025 年 6 月 11 日

Devin が開発者の GitHub ユーザー名を使用して PR を作成する機能を追加。この機能はデフォルトでオフに設定されており、GitHub の Integrations ページにある「PR Author」から選択可能。

設定は組織の全メンバーに適用され、管理者のみ変更可能。従来は Devin の名前で PR が作成されていたが、この機能により開発者自身の名前で PR を作成することが可能。

出展：Devin Release Notes - June 11, 2025

Claude Code がリモート MCP サーバーサポートを提供開始#

日付：2025 年 6 月 18 日

Anthropic が Claude Code でリモートサーバーサポートを発表。ローカルサーバー管理なしでお気に入りのツールやデータソースに接続可能。

Claude Code は開発ツール、プロジェクト管理システム、ナレッジベースなどのサードパーティサービスからコンテキストを取得し、それらのサービス内でアクションを実行可能。Sentry MCP サーバーとの統合でエラーや問題へのアクセス、Linear MCP サーバーとの統合でアクティブプロジェクトのコンテキスト活用が可能。

リモート MCP サーバーはローカルサーバーに比べて保守負担が軽く、ベンダーの URL を Claude Code に追加するだけで利用可能。ベンダーがアップデート、スケーリング、可用性を管理。ネイティブ OAuth サポートで既存アカウントへの安全な接続を実現。

出展：Remote MCP support in Claude Code

参考：Model Context Protocol (MCP) - Authropic#Authenticate with remote MCP servers

OpenAI が Agents SDK を利用したデモを公開#

日付：2025 年 6 月 19 日

OpenAI が次の 3 つの Agents SDK を利用したデモを公開。

Customer Service Agents Demo：
- OpenAI Agents SDK を使用した航空会社カスタマーサービス向けエージェントシステム。Triage Agent、Seat Booking Agent、Flight Status Agent、FAQ Agent、Cancellation Agent で構成。Python バックエンドと Next.js UI で実装
- リポジトリ：openai-cs-agents-demo
Testing Agent Demo：
- OpenAI CUA model と Responses API を使用した UI テスト自動化エージェント。Web アプリの自動テストを実行し、frontend、cua-server、sample-test-app の 3 コンポーネントで構成
- リポジトリ：openai-testing-agent-demo
Responses Starter App：
- MCP（Model Context Protocol）と code interpreter ツールをサポートするスターターアプリ。responses 機能と built-in ツールを使った開発の出発点として活用可能
- リポジトリ：openai-responses-starter-app

出展：X (Twitter) - @kagigz

OpenHands CLI がターミナル向け AI 開発エージェントとして発表#

日付：2025 年 6 月 17 日

OpenHands がターミナルから直接利用可能な CLI を発表。ソフトウェア開発エージェントをターミナルから簡単に使用可能。

インストールはpip install openhands-aiとopenhandsコマンドで完了。Docker 不要で Web インターフェースも不要。Python 3.12 または 3.13 が必要。uvx を使用した実行も対応。

完全オープンソース（MIT ライセンス）でモデル非依存。Claude 4 sonnet で最高性能を発揮し、ローカルモデルの Devstral も利用可能。SWE-Bench Verified で世界トップクラスの性能を記録。

主要機能はスラッシュコマンド（/initでリポジトリ探索とドキュメント作成）、セキュリティ向上のための確認モード、新機能追加・バグ修正・テスト追加・リファクタリング・ドキュメント作成・コード説明に対応。

出展：The OpenHands CLI: AI-Powered Development in Your Terminal

GitHub Copilot の月次プレミアムリクエスト割り当てが施行開始#

日付：2025 年 6 月 18 日

GitHub Copilot の有料プランユーザーに対する月次プレミアムリクエスト割り当てが施行開始。Copilot Pro、Pro+、Business、Enterprise プランでプレミアムリクエストの月次割り当てが強制適用される。

プレミアムリクエストは追加 AI モデルと機能の利用に使用され、モデルによって使用量が異なる。従来通り GPT-4.1 と GPT-4o のエージェントモードとチャット相互作用、無制限コード補完は継続提供。

月次割り当ては毎月 1 日にリセット。割り当て超過時は Pay-Per-Request オプションで課金設定から支払い制限を設定可能（デフォルト$0）。IDE の Copilot ステータスアイコンからリアルタイム使用量監視と詳細レポートダウンロードが可能。

出展：Update to GitHub Copilot consumptive billing experience

MiniMax-M1 が公開、100 万トークンのコンテキストウィンドウ#

日付：2025 年 6 月 16 日

中国 MiniMax が大規模言語モデル MiniMax-M1 をオープンソース化。非常に長いコンテキストウィンドウ（入力 100 万トークン・出力 8 万トークン）を持つハイブリッド Mixture-of-Experts 推論モデル。

合計 4560 億パラメータで、トークンごとに 459 億パラメータがアクティブ。Lightning Attention メカニズムにより、DeepSeek R1 と比較して 10 万トークンコンテキストで 25%の FLOP しか消費せず、テスト時計算を効率的にスケーリング。

競技レベルの数学、コーディング、ソフトウェアエンジニアリング、エージェントツール使用、長文理解タスクで主要商用 AI モデルに匹敵する性能を発揮。SWE-bench Verified で 69.1 を記録。

トレーニング予算はわずか 53 万 4700 ドル（約 7800 万円）。Apache 2.0 ライセンスで GitHub と Hugging Face から利用可能。vLLM と Transformers での実装をサポート。

出展：MiniMax-M1