3549 文字
18 分

AI Weekly 2025-04-10

ChatGPT が過去の会話全てを参照可能に#

日付:2025 年 4 月 10 日

OpenAI は ChatGPT のカスタマイズとメモリー機能を大幅に拡張しました。これにより、過去の会話全てを記憶し、その情報を基に応答を調整できるようになりました。以前の「Memory」機能は限られた数の情報のみを保持していましたが、新機能では「reference chat history」オプションにより、全ての過去の会話をコンテキストとして使用できます。

この新機能は ChatGPT Plus と Pro ユーザー向けに段階的に展開されています。Enterprise、Team、Edu ユーザー向けの展開は後日予定されています。無料ユーザー向けの提供予定は現時点で発表されていません。

ユーザーはこの機能を完全に無効化することも可能で、Temporary Chat(シークレットモード)では使用されません。ただし、以前から ChatGPT との会話ログは OpenAI のサーバーに保存されていることに注意が必要です。

出展:ChatGPT can now remember and reference all your previous chats

Any-Agent#

日付:2025 年 4 月 10 日

Mozilla.ai が Any-Agent を発表しました。これは様々なエージェントフレームワーク(LangChain、smolagents、AWS Bedrock Agents、CrewAI、AutoGen、Agno など)とコードの間の抽象化レイヤーを提供する新しいライブラリです。Any-Agent を使用することで、一度エージェントを構築すれば、異なるフレームワーク間での切り替えが容易になり、フレームワーク固有の実装の詳細に依存することなく開発が可能になります。また、open-inference によるログの正規化もサポートされており、選択したフレームワークに関係なく一貫した出力を確認できます。

出展:Introducing Any-Agent: An abstraction layer between your code and the many agentic frameworks

Agent2Agent プロトコル#

日付:2025 年 4 月 9 日

Google は異なる AI エージェント間の相互運用性を実現する Agent2Agent(A2A)プロトコルを発表しました。Atlassian、Salesforce、SAP、ServiceNow などの主要な技術パートナーと、Accenture、Deloitte、KPMG、PwC などの主要なサービスプロバイダーのサポートと貢献を得て開発されました。

A2A プロトコルは以下の 5 つの設計原則に基づいています。

  • エージェントの能力を最大限に活用
  • 既存の標準(HTTP、SSE、JSON-RPC)を基盤とした実装
  • デフォルトでのセキュリティ確保
  • 長時間実行タスクのサポート
  • モダリティに依存しない設計

このプロトコルにより、異なるベンダーやフレームワークで構築された AI エージェント同士が安全に情報を交換し、様々なエンタープライズプラットフォームやアプリケーション上でアクションを調整できるようになります。特に、エージェントの能力発見、タスク管理、コラボレーション、ユーザー体験の交渉などの機能が実現されます。

出展:A2A: A new era of agent interoperability

Devin 2.0#

日付:2025 年 4 月 3 日

Devin 2.0 がリリースされ、エージェントネイティブな IDE 体験を提供する新しいバージョンとなりました。また、月$500ではなく$20 の従量課金からの利用が可能になりました。

主な新機能として、VS Code 環境でのインタラクティブな開発体験が実現され、リアルタイムでのコード編集の追跡やターミナルコマンドの自然言語からの生成(⌘K)、素早い応答とファイル編集(⌘I)が可能になりました。また、複数の Devin を並列で起動して複数のタスクを同時に処理できるようになり、各 Devin は自律的に動作します。

コラボレーティブな計画パートナーとしての機能も強化され、タスク実行前に仕様を精緻化する支援を行います。Devin Search 機能では、コードベースに関する質問に素早く回答し、Deep Mode ではより詳細なコードベース探索が可能です。さらに、Devin Wiki では、リポジトリの詳細なアーキテクチャ図、ソースへのリンク、ドキュメントなどを自動生成します。

パフォーマンス面では、内部ベンチマークでジュニア開発者のタスクの 83%以上を効率的に完了できるようになり、ACU(Agent Compute Unit)の効率が大幅に向上しています。

出展:Devin 2.0 Release Notes

GitHub Copilot in VS Code March release (v1.99)#

日付:2025 年 4 月 3 日

Visual Studio Code の 2025 年 3 月リリース(v1.99)で、GitHub Copilot に重要なアップデートが加わりました。エージェントモードのアップグレードとして、MCP サポートの追加、API キーによるモデルの使用、その他の機能が実装されました。

エージェントモードが VS Code stable で利用可能になり、ユーザーは段階的に利用できるようになります。最新の VS Code バージョンに更新することで、手動でエージェントモードを有効化することも可能です。Model Context Protocol(MCP)サーバーのサポートにより、エージェントフローに数百の専門ツールから選択できるようになり、Web コンテンツの取得やシンボル参照の検索などの新しい組み込みツールも利用可能です。

ユーザーエクスペリエンスの改善として、1 つのビューで ask、edit、agent モードを切り替えられるようになり、Next edit suggestions(NES)が一般提供され、気を散らすことなく次の編集を提案するように最適化されました。

モデルの選択肢も拡大し、Anthropic Claude、Google Gemini、OpenAI モデルがモデルセレクターで一般提供され、Anthropic、Azure、Google Cloud、OpenAI などのプロバイダーの API キーを使用して任意のモデルを選択できるようになりました。

出展:VS Code March Release v1.99

Thinking tool#

Anthropic の研究に基づいて開発された思考ツールが追加され、モデルがツール呼び出しの間に思考する機会を提供します。これにより、複雑なタスクにおけるエージェントのパフォーマンスが向上し、SWE-bench 評価でも改善が見られています。

この機能はgithub.copilot.chat.agent.thinkingTool設定で有効化できます。有効化することで、エージェントが複雑なタスクを処理する際に、より深い思考プロセスを経てより正確な結果を提供できるようになります。

Fetch tool#

#fetchツールを使用することで、公開アクセス可能な Web ページのコンテンツをプロンプトに含めることができます。例えば、MCP の最新ドキュメントを取得してプロンプトで使用するなど、LLM が消費しやすい形式で情報を取得できます。このツールはヘッドレスブラウザウィンドウでページをレンダリングし、データをローカルにキャッシュするため、再レンダリングのオーバーヘッドなしに何度でもコンテンツを取得できます。

以下のような形式で使用できます。

#fetch https://example.com/documentation

または、エージェントモードでは自然言語で「このページの内容を取得して」と指示するだけで自動的に検出されます。

現在の制限として、JavaScript が無効化されているため、JavaScript に依存する Web サイトのコンテキスト取得は制限されています。また、認証が必要なページの取得も不可能です。これらの制限を回避するには、目的に特化した MCP サーバーや Playwright MCP サーバーなどの汎用ブラウザ MCP サーバーの使用が推奨されます。

Usages tool#

#usagesツールは「Find All References」「Find Implementation」「Go to Definition」の機能を組み合わせたものです。このツールを使用することで、関数、クラス、インターフェースに関する詳細な情報を取得できます。例えば、インターフェースのサンプル実装を探したり、リファクタリング時に変更が必要な箇所を特定したりする際に役立ちます。

エージェントモードではこれらのツールが自動的に検出されますが、他のモードでも#fetch#usagesを明示的に参照して使用できます。

Gemini 2.5 Flash と Pro、Live API、Veo 2 の一般提供開始#

日付:2025 年 4 月 9 日

Google は Gemini 2.5 シリーズの新モデルをリリースしました。Gemini 2.5 Pro は、最も高度なコーディングモデルとして、視覚的に魅力的な Web アプリの作成やエージェントプログラミングアプリケーションの開発に優れています。また、Gemini 2.5 Flash は、低レイテンシーとコスト効率を維持しながら、思考能力を組み込んだ進化版として近日公開予定です。これらのモデルは、100 万トークンの入力コンテキストウィンドウを備え、より高度なエージェントの実現やマルチエージェントシステムの管理、コードベース全体の生成的な推論の加速を可能にします。

また Veo 2 が Gemini API で一般提供を開始しました。テキストや画像のプロンプトから高品質な動画を生成でき、720p 解像度で 24 フレーム/秒の 8 秒までの動画クリップを生成できます。さらに Live API for Gemini models がプレビュー版として利用可能になり、ストリーミングオーディオ、ビデオ、テキストを低レイテンシーで処理できるようになりました。30 の新しい言語と 2 つの新しい音声オプション、設定可能な Voice Activity Detection(VAD)、スライディングコンテキストウィンドウによる事実上無限のセッションサポートなどの機能が追加されています。

出展:Gemini 2.5 Flash and Pro, Live API, and Veo 2 in the Gemini API

Google Cloud Agent Development Kit 1.0#

日付:2025 年 4 月 9 日

Google Cloud はマルチエージェントアプリケーションの開発を容易にする Agent Development Kit(ADK)1.0 をリリースしました。ADK は、Agentspace や Google Customer Engagement Suite(CES)などの Google 製品で使用されているフレームワークをオープンソース化したものです。

ADK は、複数の専門化されたエージェントを階層的に組み合わせて、モジュール化されたスケーラブルなアプリケーションを構築することを可能にします。Gemini や Vertex AI Model Garden、LiteLLM などを通じて様々なモデルを選択でき、検索、コード実行、Model Context Protocol(MCP)ツールなどの多様な機能を提供します。また、双方向のオーディオ・ビデオストリーミングをサポートし、ワークフローエージェント(Sequential、Parallel、Loop)や LLM 駆動の動的ルーティングを提供します。強力な CLI と Web UI による統合開発環境を備え、エージェントのパフォーマンス評価とコンテナ化によるデプロイもサポートしています。

ADK は Google Cloud エコシステムと特に相性が良く、Gemini モデルや Vertex AI とのシームレスな統合、100 以上の事前構築済みコネクタ、Application Integration によるワークフロー、AlloyDB、BigQuery、NetApp などのデータソースへのアクセス、Apigee による API 管理などを活用できます。

出展:Agent Development Kit: Easy to build multi-agent applications

NotebookLM がソースを検索する機能を追加#

日付:2025 年 4 月 2 日

Google NotebookLM が「Discover sources」機能を追加しました。この機能により、ユーザーは興味のあるトピックを記述するだけで、ウェブから関連する情報源を自動的に発見し、まとめることができます。NotebookLM は数百の潜在的なウェブソースを数秒で収集し、トピックに基づいて最も関連性の高いものを選択します。最大 10 個のソース推奨が表示され、それぞれにトピックとの関連性を説明する注釈付きの要約が含まれています。

ユーザーはワンクリックでこれらのソースをノートブックに追加でき、Briefing Docs、FAQs、Audio Overviews などの他の NotebookLM 機能と組み合わせて使用できます。また、新規ユーザー向けに「I’m Feeling Curious」ボタンも追加され、ランダムなトピックに関するソースを生成して、ソース発見エージェントの動作を確認できます。この機能は Gemini を活用しており、すべての NotebookLM ユーザーに約 1 週間かけて段階的に展開されます。

出展:NotebookLM Discovers Sources from Around the Web

GitHub Copilot Pro+と複数の新モデル一般提供開始#

日付:2025 年 4 月 4 日

GitHub は開発者のコーディング体験をさらに向上させるための新しい個人向けプラン「GitHub Copilot Pro+」を発表しました。このプランでは、GitHub Copilot Pro の既存機能に加えて、最新モデル(GPT-4.5 が本日利用可能)への独占アクセス、プレビュー機能への優先アクセス、5 月 5 日から利用可能になる月間 1,500 回のプレミアムリクエストが提供されます。これらは、ベースモデルを使用する際のエージェントモード、コンテキスト駆動型チャット、コード補完の無制限リクエストに加えて利用可能です。

また、Anthropic Claude 3.7 Sonnet、Claude 3.5 Sonnet、OpenAI o3-mini、Google Gemini Flash 2.0 などの複数の新モデルが GitHub Copilot で一般提供を開始しました。これらのモデルはプレビューリリースから一般提供リリースに移行し、Copilot Chat とエージェントモードで生成されたコードに対する知的財産権侵害の補償が拡大されました。

4 月 8 日には DeepSeek v3.0324 の一般提供も開始されました。

出展:

Copilot code review の一般提供開始#

日付:2025 年 4 月 4 日

GitHub Copilot のコードレビュー機能が一般提供を開始しました。コードレビューはソフトウェア開発において最も重要なプロセスの 1 つですが、手動でのレビューは時間がかかります。Copilot code review は、バグや潜在的なパフォーマンスの問題を発見し、修正案を提案する Copilot エージェントに基本的なレビューを任せることで、人間によるレビューを待つ間もコードの改善を進めることができます。これにより、コードリポジトリの保守性と品質を向上させることが可能になります。

パブリックプレビュー開始から 1 か月余りで、100 万人以上の開発者が Copilot code review を利用し、大きな反響を得ています。Visual Studio Code と GitHub の両方で利用可能で、リポジトリルールを通じて自動レビューを設定したり、プルリクエストに対してオンデマンドでレビューを依頼したりすることができます。

Copilot code review は有料 Copilot ユーザーが利用可能です。組織やエンタープライズでは「Copilot in github.com」ポリシーを通じて有効化できます。

出展:Copilot code review now generally available

github-mcp-server のパブリックプレビュー開始#

日付:2025 年 4 月 4 日

GitHub は新しいオープンソースの公式ローカル GitHub MCP Server をリリースしました。Anthropic と協力して、彼らのリファレンスサーバーを Go で書き直し、使いやすさを向上させました。新しいサーバーは旧サーバーの機能を 100%保持しつつ、ツールの説明のカスタマイズ、コードスキャニングのサポート、そして「Show me my private repos」のような自然言語での問い合わせに対するユーザー体験を改善する新しいget_me関数を追加しています。

VS Code でネイティブにサポートされており、リポジトリを訪問してセットアップ方法を確認できます。

出展:github-mcp-server is now available in public preview

AI Weekly 2025-04-10
https://blog.ohirunewani.com/series/ai-weekly/2025-04-10/
作者
hrdtbs
公開日
2025-04-10
ライセンス
CC BY-NC-SA 4.0