Skip to content

AI Weekly 2025-12-11

#OpenAI GPT-5.2

日付:2025年12月11日

OpenAIが「GPT-5.2」をリリースした。これまでで最も高性能なモデルシリーズとされ、専門的な知識労働や長時間稼働するエージェント向けに最適化されている。モデルはInstant、Thinking、Proの3種類が展開される。

ベンチマークでは、最上位のGPT-5.2 Proが抽象的推論(ARC-AGI-2)で54.2%、大学院レベルのQ&A(GPQA Diamond)で93.2%を記録。SWE-bench Verifiedでは80%を達成し、大規模コードベースのリファクタリングやデバッグ能力が飛躍的に向上した。知識労働タスク評価(GDPval)でも業界の専門家を凌駕するパフォーマンスを示している。

価格は、標準モデルが入力$1.75/出力$14.00、Proモデルが入力$21.00/出力$168.00(100万トークンあたり)。標準モデルはGemini 3 Pro($2/$12)やClaude Opus 4.5($5/$25)と比較して競争力のある価格設定だが、Proモデルはそれらを大きく上回る高価格帯となっている。知識カットオフは2025年8月31日に更新された。エンタープライズ向けの「Garlic」バージョンでは、40万トークンのコンテキストと12.8万トークンの出力をサポートする。

出展:GPT-5.2 が登場

#Google AI、Interactions APIが発表

日付:2025年12月11日

Googleが「Interactions API」を発表した。これはGeminiモデルやエージェントと対話するための統一されたインターフェースであり、現在はパブリックベータとして提供されている。

このAPIは単一のRESTfulエンドポイント(/interactions)を提供し、モデルパラメータやエージェントパラメータを指定して対話を行う。またGemini Deep Research(deep-research-pro-preview-12-2025)へのアクセスがサポートされている。

from google import genai
client = genai.Client()
interaction = client.interactions.create(
agent="deep-research-pro-preview-12-2025",
input="Research the history of Google TPUs.",
background=True
)

出展:Interactions API: A unified foundation for models and agents

#Julesにプロアクティブなコーディング機能の追加

日付:2025年12月11日

Google Labsのコードエージェント「Jules」に、プロアクティブなコーディング機能が追加された。ユーザーからの指示を待つだけでなく、バックグラウンドで自律的にタスクを提案・実行することが可能になった。

新たに追加された「Suggested Tasks」機能では、リポジトリを継続的にスキャンし、TODOコメントの解消などの改善案を自動的に作成して提案する。また「Scheduled Tasks」機能では、依存関係の更新や定期的なメンテナンスなど、予測可能なタスクを指定したスケジュールで実行できる。これらはGoogle AI ProおよびUltraのサブスクライバー向けに提供される。

出展:Jules from Google Labs introduces proactive coding features

#Cursor 2.2のリリース

日付:2025年12月10日

Cursor 2.2がリリースされた。新機能として「Debug Mode」と「Cursor Browser向けビジュアルエディタ」が追加されたほか、Plan Modeの改善も行われている。

Debug Modeは、アプリにランタイムログを埋め込むことでバグの根本原因を特定し、修正作業を支援する機能。様々なスタックや言語、モデルに対応している。

Cursor Browser向けビジュアルエディタでは、Webアプリ、コードベース、ビジュアル編集ツールを同じウィンドウでシームレスに扱える。主な機能は以下の通り:

  • ドラッグ&ドロップ: DOMツリー上で要素を直接操作してレイアウトを調整できる。
  • コンポーネント状態のテスト: サイドバーでReactコンポーネントのpropsを直接編集し、異なる状態を即座に確認できる。
  • ビジュアルコントロール: スライダーやカラーピッカーなどのUIでスタイルを調整し、コードに反映できる。
  • クリックして指示(Point and Prompt): 画面上の要素をクリックし、自然言語で変更を指示するだけで、エージェントがコードを修正してくれる。

またPlan ModeがインラインのMermaid図に対応し、エージェントがプラン内にビジュアルを自動生成できるようになった。

出展:2.2 | Cursor - The AI Code Editor

#VS Code v1.107

日付:2025年12月10日

VS Code v1.107 (November 2025) がリリースされた。マルチエージェントオーケストレーションが導入され、GitHub Copilotとカスタムエージェントが連携して開発を加速できるようになった。Agent HQで全てのエージェントを一元管理でき、バックグラウンドエージェントはGitワークツリーを使用して隔離された環境で実行されるため、メインの作業を中断せずにタスクを委譲できる。

また、チャットビューにエージェントセッションが統合され、進捗状況やファイル変更の統計を一目で確認できるようになった。Model Context Protocol (MCP) の最新仕様もサポートされ、GitHub Copilot ChatによるGitHub MCP Serverもプレビュー提供されている。

実験的な機能として、Claude Codeの「Skills」をVS Codeのエージェントでも再利用可能になった。chat.useClaudeSkills設定を有効にすると、~/.claude/skillsやワークスペース内の.claude/skillsフォルダに定義されたスキルを自動的に検出し、エージェントが利用できるようになる。

出展:Visual Studio Code November 2025

#Devin Updates、データ分析に特化したDanaの公開

日付:2025年12月5日

Devinの12月5日のアップデートでは、データ分析に特化した「Data Analyst Devin (Dana)」が全ユーザーに公開された。MCP経由でデータソースに接続するだけで、データの探索や可視化、インサイトの取得が可能になる。

またエンタープライズ向けの機能強化として、詳細なリソース使用状況を確認できる「Consumption Analytics」や、Azure DevOpsリポジトリのPRコメントやステータス更新を自動化するWebhookサポートが追加された。API面でもv3ベータエンドポイントの追加やサービスユーザーページの改善(ロールフィルタの統合など)が行われている。

出展:Release Notes - Devin Docs

#GitHub MCP Server、ツールの構成設定サポート

日付:2025年12月10日

GitHub MCP Serverがツール固有の構成設定(Tool-specific configuration)をサポートした。 新しいX-MCP-Toolsヘッダーを使用することで、必要なツールのみを有効化し、コンテキストウィンドウの使用量を最小限に抑えることができる。例えば、filesystem_read_fileのみを許可し、他のツールを無効化するといった制御が可能になる。

また、公式Go SDKへの移行が行われたほか、セキュリティ強化として「Lockdown mode」が導入された。これにより、プロンプトインジェクションに対するコンテンツのサニタイズや、パブリックリポジトリに対する読み取り専用モード(書き込みツールの無効化)が適用される。

出展:The GitHub MCP Server adds support for tool-specific configuration, and more

#Google Cloud、公式MCPサポートを発表、BigQueryなど

日付:2025年12月11日

Google Cloudが「Model Context Protocol (MCP)」の公式サポートを発表した。 GoogleおよびGoogle Cloudサービス向けのフルマネージドなMCPサーバーが提供され、Gemini CLIや他のMCPクライアントから容易に利用可能になる。

初期ラインナップとして、以下のサービスが対応する:

  • Google Maps (Grounding Lite): 位置情報、天気、ルート情報の取得
  • BigQuery: スキーマ解釈とクエリ実行
  • Google Compute Engine (GCE): インフラのプロビジョニングと管理
  • Google Kubernetes Engine (GKE): クラスタ管理と障害診断

また、Apigeeとの統合により、組織内のAPIをエージェント用ツールとして公開・管理することも可能になる。セキュリティ面ではCloud IAMによる制御や監査ログ、Model Armorによるプロンプトインジェクション対策が統合されている。 Googleは「Agentic AI Foundation」の創設メンバーとして、オープンソースコミュニティを通じたMCPの発展に貢献するとしている。

出展:Announcing official MCP support for Google services

#Chrome DevTools MCPが実行中のブラウザへの自動接続をサポート

日付:2025年12月11日

Chrome DevTools MCPサーバーが機能強化され、コーディングエージェントが実行中のChromeセッションに直接接続できるようになった。 これにより、既存のログインセッションの再利用や、DevToolsで特定した問題(失敗したネットワークリクエストや特定のDOM要素など)をエージェントに引き継いで調査させることが可能になる。

これまではMCPサーバー用の独立したプロファイルで起動する必要があったが、Chrome M144(Beta)以降のリモートデバッグ機能と--autoConnectオプションを利用することで、ユーザーが普段使用しているブラウザインスタンスに接続できる。

出展:コーディング エージェントが Chrome DevTools MCP を使用してブラウザ セッションをデバッグできるようにする

#Claude Code and Slack

日付:2025年12月9日

Anthropicは、Claude CodeとSlackの統合機能(Beta)を発表した。 Slackのスレッド内で @Claude をメンションすることで、その会話のコンテキスト(バグレポート、機能リクエスト、技術的な議論など)を読み取り、自動的にClaude Codeのセッションを開始できる。 Claudeは進行状況をスレッドに返信し、完了後には変更内容のレビューやプルリクエスト作成へのリンクを提供する。これにより、チャットツールでの議論から実装までのフローがシームレスになる。

出展:Claude Code and Slack

#Agentic AI Foundationの設立

日付:2025年12月9日

Linux Foundationは、エージェントAIシステムの透明性と開発を促進するための「Agentic AI Foundation (AAIF)」の設立を発表した。 この財団は、AIエージェントインフラストラクチャのためのベンダー中立的なガバナンスを提供することを目的としている。

設立メンバーには、AWS、Anthropic、Block、Google、IBM、Microsoft、OpenAIなどが名を連ねている。 初期の主要プロジェクトとして以下の3つがホストされる:

  • Model Context Protocol (MCP): Anthropicが寄贈。AIモデルとツール間の接続プロトコル。
  • goose: Blockが寄贈。ローカルファーストのオープンソースAIエージェントフレームワーク。
  • AGENTS.md: OpenAIが寄贈。AIコーディングエージェントのためのプロジェクト固有のガイダンス標準。

出展:Linux Foundation Announces the Formation of the Agentic AI Foundation

#Google Translate、Geminiによる翻訳機能強化

日付:2025年12月12日

Google翻訳に、Geminiを活用した新しい翻訳モデルと機能が追加された。 テキスト翻訳では、イディオムや現地の表現、スラングなどのニュアンスを含むフレーズで、より自然で正確な翻訳が可能になった。

また、Geminiの音声モデルを活用した「リアルタイム音声翻訳(Live Translate)」のベータ版も導入された。 話者のトーン、強調、リズム(抑揚)を維持しながら翻訳することで、より自然な会話体験を提供する。 現在はAndroid版(米国、メキシコ、インド)で先行提供されている。

これらの機能強化により、単なる言葉の置き換えではなく、文脈や意図を汲み取った翻訳が実現されている。

出展:Google Translate gets new Gemini AI translation models

#Google Labs、GenTabsを搭載したブラウザDiscoを発表

日付:2025年12月11日

Google LabsがDiscoを発表した。これはタブやチャット履歴から複雑なタスクを理解し、Gemini 3でインタラクティブなWebアプリケーションを生成するブラウジング実験。 ユーザーはコードを書かずに自然言語でツールを記述し、洗練できる。タスクに応じて未検討のアプリも提案される。 生成要素は常に元のソースにリンクされる。 macOS向けにウェイトリストが公開されている。

出展:Take the web for a fresh spin with GenTabs, built with Gemini 3