AI Weekly 2025-06-26
Google Gemma 3n 正式リリース - モバイルファーストのマルチモーダル AI
日付:2025 年 6 月 26 日
Google が Gemma 3n の正式版をリリース。5 月のプレビューから完全版となり、モバイルデバイス向けに最適化されたマルチモーダル AI モデル。
Gemma 3n は MatFormer architecture と呼ばれる Matryoshka Transformer による入れ子構造を採用し、E2B(実効 2B)と E4B(実効 4B)の 2 サイズを提供する。画像、音声、動画、テキスト入力に対応し、テキスト出力が可能。Per-Layer Embeddings(PLE)により、E2B は 2GB、E4B は 3GB のメモリで動作する。
音声処理では自動音声認識(ASR)と音声翻訳(AST)をサポート。新しい vision encoder として MobileNet-V5-300M を搭載し、Google Pixel で 60FPS 処理が可能。
E4B 版は LMArena スコア 1300 超を達成し、100 億パラメータ未満で初めてこのベンチマークに到達。140 言語のテキスト処理と 35 言語のマルチモーダル理解に対応。
Hugging Face Transformers、llama.cpp、Google AI Edge、Ollama、MLX などの主要ツールで利用可能。Gemma 3n Impact Challenge も開催中で、賞金総額 15 万ドル。
Claude Artifacts で AI 搭載アプリの構築・共有が可能に
日付:2025 年 6 月 25 日
Anthropic が Claude アプリ内でインタラクティブな AI 搭載アプリの構築、ホスティング、共有機能を導入。開発者はスケーリングの複雑さやコストを気にせずに AI アプリの反復開発が可能になる。
Claude Artifacts が Claude API と連携し、AI 搭載アプリとして機能する。ユーザーが作成したアプリを他の人が利用する際、利用者は自身の Claude アカウントで認証し、API 使用量は利用者のサブスクリプションにカウントされる。作成者は他の人の使用量に対して費用を支払う必要がない。
コミュニティでは既に、会話を記憶し選択に適応する NPC を持つ AI 搭載ゲーム、個別のスキルレベルに調整される学習ツール、CSV アップロードと自然言語での質問が可能なデータ分析アプリ、複数の Claude 呼び出しを調整するエージェントワークフローなどが構築されている。
現在の制限として、外部 API 呼び出し不可、永続ストレージなし、テキストベースの補完 API に限定されている。Free、Pro、Max プランユーザーがベータ版として利用可能。
Cloudflare Containers 、エッジで動作するコンテナをパブリックベータ提供
日付:2025 年 6 月 24 日
Cloudflare が Workers と統合された Containers サービスをパブリックベータとして有料プランユーザーに提供開始。Workers と並行して新しいタイプのアプリケーションを実行可能になる。
Containers はグローバルに展開され、Region
利用例として、ユーザー生成コードのサンドボックス実行、FFmpeg を使った動画から GIF への変換、cron ジョブでのコンテナ実行、静的フロントエンドとコンテナ化バックエンドの組み合わせなどが可能。Durable Objects、Workflows、Queues、R2 などの他の Cloudflare サービスとも統合される。
料金はメモリ、CPU、ディスクの使用時間に基づく従量課金制。dev(256MiB、1/16vCPU)、basic(1GiB、1/4vCPU)、standard(4GiB、1/2vCPU)の 3 つのインスタンスタイプを提供。Workers Standard プランには月間利用量が含まれる。
出展:Containers are available in public beta for simple, global, and programmable compute
Vercel Sandbox、AI 生成コードを安全に実行する環境がベータ提供
日付:2025 年 6 月 25 日
Vercel が Fluid compute を活用した Vercel Sandbox をベータ版として提供開始。AI エージェントが生成したコードなど、信頼できないコードを分離された一時的な環境で安全に実行できる。
Sandbox は独立した SDK として提供され、Vercel 以外のプラットフォームからも実行可能。ワークロードは一時的で分離された microVM 上で動作し、最大 45 分間の実行時間をサポートする。新しい Sandbox SDK を通じて、コード生成からファイル書き込み、コマンド実行までを一連の流れで処理できる。
料金体系は Fluid compute モデルを採用し、Active CPU 時間に基づく課金で CPU を実際に使用している時間のみ請求される。Hobby と Pro チームには月間利用量が含まれる。全プランのユーザーがベータ版として利用可能。
Gemini CLI、オープンソース AI エージェント CLI がプレビュー提供
日付:2025 年 6 月 26 日
Google が Gemini 2.5 Pro を搭載したオープンソースの AI エージェント「Gemini CLI」をプレビュー版として提供開始。ターミナル環境でコード理解、ファイル操作、コマンド実行、動的トラブルシューティングが可能になる。
Gemini CLI は無料で利用でき、個人の Google アカウントでログインするだけで Gemini Code Assist ライセンスを取得できる。100 万トークンのコンテキストウィンドウを持つ Gemini 2.5 Pro へのアクセスが可能で、業界最大級の利用制限として毎分 60 リクエスト、1 日 1000 リクエストまで無料で利用できる。
Google Search 連携によるプロンプトのグラウンディング、Model Context Protocol(MCP)サポートによる拡張機能、カスタムプロンプト設定、スクリプト内での非対話的実行などの機能を提供。Apache 2.0 ライセンスで完全にオープンソース化されており、GitHub リポジトリでコミュニティ貢献を受け入れている。
VS Code の Gemini Code Assist とも技術を共有し、エージェントモードでマルチステップの計画作成、自動復旧、ソリューション提案が可能。全プラン(無料、Standard、Enterprise)で Insiders チャンネルから追加費用なしで利用できる。
出展:Introducing Gemini CLI, an open source AI agent for your terminal
Anthropic、購入書籍での AI 学習にフェアユース勝訴も海賊版利用で別途裁判
日付:2025 年 6 月 24 日
カリフォルニア州北部地区の William Alsup 判事が Anthropic の AI 著作権訴訟で部分的勝訴の判決。合法的に購入した書籍での AI モデル学習は著者の許可なしでもフェアユースと認定された。AI 業界初の有利な判決となる。
判事は物理的な書籍を購入し、製本を外して切断、スキャンしてデジタルライブラリ化する行為をフェアユースと認定。さらにそのデジタルコピーを使った LLM 学習も十分に変革的でフェアユースに該当すると判断した。「著者の訴えは、学童に良い文章を書くよう教えることが競合作品の爆発的増加をもたらすと訴えることと変わらない」と述べている。
一方で、Anthropic がインターネットから数百万冊の海賊版書籍をダウンロードし中央ライブラリに保存した行為はフェアユースに該当しないと判断。合法的に購入または入手可能だった書籍を海賊版サイトからダウンロードする必要性を説明できないとして、海賊版コンテンツ利用については別途裁判が行われる。
この訴訟は作家 Andrea Bartz、Charles Graeber、Kirk Wallace Johnson が昨年、Anthropic が Claude AI モデルを海賊版素材で学習させたとして提起したもの。今回の判決は今後の AI 著作権訴訟の判断に影響を与える可能性がある。
出展:Anthropic wins a major fair use victory for AI — but it’s still in trouble for stealing books
Google Imagen 4、Gemini API と Google AI Studio で利用可能に
日付:2025 年 6 月 24 日
Google が Imagen 4 を Gemini API の有料プレビューと Google AI Studio の限定無料テストで提供開始。これまでで最高の text-to-image モデルとして、特にテキストレンダリングが大幅に改善された。
Imagen 4 ファミリーには 2 つのモデルが含まれる。標準の Imagen 4 は幅広い画像生成タスクに対応し、Imagen 3 から品質が大幅に向上、1 出力画像あたり 0.04 ドルで提供。Imagen 4 Ultra はプロンプトに対してより高精度な出力を生成し、テキスト指示により厳密に従った結果を生成、1 出力画像あたり 0.06 ドルで提供される。
すべての Imagen 4 生成画像には信頼性と透明性のため、非可視のデジタル SynthID 透かしが埋め込まれる。数週間以内に追加の料金体系が導入予定で、現在はより高いレート制限をリクエスト可能。
出展:Imagen 4 is now available in the Gemini API and Google AI Studio
AI ファースト Google Colab、全ユーザーに提供開始
日付:2025 年 6 月 24 日
Google が Google I/O 2025 で発表した AI ファースト Google Colab を全ユーザーに提供開始。ノートブック内で AI が真のコーディングパートナーとして機能し、困難な問題をこれまで以上に高速で解決できるよう設計されている。
主な利用方法として、機械学習プロジェクトの全ライフサイクルでの活用がある。生データセットから AI エージェントが自律的にクリーニングと準備を実行し、特徴量分析、モデル訓練、結果評価まで対話形式で進行する。デバッグ支援では、ペアプログラマーとしてプロトタイプ作成、ボイラープレートコード生成、新しいライブラリの理解をサポートし、エラー発生時は修正案を明確な diff 表示で提案する。
新機能には対話型クエリ、次世代データサイエンスエージェント(DSA)、簡単コード変換が含まれる。DSA は自律的な分析ワークフローを実行し、計画作成、コード実行、結果推論、結果提示を行いながらユーザーのフィードバックと制御を可能にする。コード変換では自然言語での変更記述により、関連コードの特定とリファクタリングを自動実行する。
ツールバーの Gemini スパークアイコンから利用開始でき、Google Labs Discord コミュニティの#colab-ai チャンネルでフィードバック共有が可能。
出展:Supercharge your notebooks: The new AI-first Google Colab is now available to everyone
Google Cloud、Agent2Agent (A2A)プロトコルを Linux Foundation に寄贈
日付:2025 年 6 月 23 日
Open Source Summit North America で Linux Foundation が Agent2Agent プロジェクトの設立を発表。Amazon Web Services、Cisco、Google、Microsoft、Salesforce、SAP、ServiceNow が参加し、AI エージェント間の相互運用性を促進するオープンエコシステムの構築を目指す。
Google は Agent2Agent (A2A)プロトコル仕様、付属 SDK、開発者ツールを Linux Foundation に移管。A2A プロトコルは異なる AI エージェント間のコミュニケーションと協調のためのオープン標準で、現在 100 社以上がサポートしている。AI エージェントが互いの能力を発見し、安全に情報交換し、複雑なタスクを調整するための共通言語を提供する。
Linux Foundation の中立的ガバナンスにより、ベンダー非依存でコミュニティ主導の開発が保証される。プロジェクトの主要目標は、A2A 仕様の業界標準としての確立、グローバルな開発者コミュニティの育成、中立的ガバナンスの提供、安全な協調 AI エージェントを活用した革新的アプリケーション開発の促進。
GitHub Copilot で Anthropic Claude Sonnet 4/Opus 4 が正式提供開始
日付:2025 年 6 月 25 日
Anthropic の Claude Sonnet 4 と Claude Opus 4 が GitHub Copilot で正式に利用可能になった。
出展:Anthropic Claude Sonnet 4 and Claude Opus 4 are now generally available in GitHub Copilot
GitHub Copilot coding agent、Copilot Business/Pro プランに提供開始
日付:2025 年 6 月 26 日
GitHub Copilot coding agent が Copilot Business と Copilot Pro プランで利用可能になった。先月 Copilot Pro+と Copilot Enterprise ユーザー向けにパブリックプレビューで開始された coding agent が、6 月 24 日に Copilot Business ユーザー、6 月 26 日に Copilot Pro ユーザー向けにパブリックプレビューとして提供開始。
また 6 月 19 日のアップデートにより、Copilot coding agent へのアクセス権を持つユーザーの場合、Copilot coding agent へのアクセスがすべてのリポジトリでデフォルト利用可能になった。以前は各リポジトリで明示的にオプトインする必要があったが、現在は自動的に有効化され、組織オーナーやエンタープライズ管理者、ユーザーがいつでもオプトアウトを選択できる。
出展:
VS Code、おすすめ MCP サーバ一覧ページを公開
日付:2025 年 6 月 20 日
Microsoft が VS Code で動作するおすすめ MCP サーバーの一覧ページを公開。おすすめの MCP サーバーをキュレーションし、ワンクリックインストール機能と合わせて開発者の利用を促進。
一覧ページでは開発者ツール、生産性、データ・分析、ビジネスサービス、クラウド・インフラの 5 つのカテゴリに分類。開発者ツールでは GitHub(リポジトリ・issue・PR 管理)、Figma(UI 抽出とコード生成)、Playwright(ブラウザ自動化)、Sentry(エラー分析)などを提供。生産性ツールには Notion(ページ・データベース管理)、Linear(プロジェクト管理)、Sequential Thinking(複雑タスクの分解)、Memory(セッション間の情報保存)などが含まれる。データ・分析では DuckDB(データクエリ)、PostHog(プロダクト分析)、Neon(Postgres 管理)、ビジネスサービスでは Stripe(決済)、PayPal(請求書・決済)、Webflow(サイト管理)などが利用可能。
Anthropic Desktop Extensions、MCP サーバーをワンクリックインストール
日付:2025 年 6 月 26 日
Anthropic が Claude Desktop 向けに Desktop Extensions 機能を導入。MCP サーバーの複雑なインストール過程を解決し、.dxt
ファイルのダブルクリックだけで MCP サーバーを導入可能になった。
従来の MCP サーバーインストールは Node.js や Python の環境構築、JSON 設定ファイルの手動編集、依存関係の解決など技術的な障壁が高かった。Desktop Extensions では全ての依存関係を含む.dxt
ファイル(zip アーカイブ)として配布し、Claude Desktop が内蔵する Node.js ランタイムで実行する。
.dxt
ファイルにはmanifest.json
でメタデータと設定を定義し、サーバーファイル、依存関係、アイコンを含む。ユーザー設定は OS のキーチェーンに安全に保存され、自動更新もサポート。クロスプラットフォーム対応、動的設定、機能宣言などの高度な機能も提供する。
Anthropic は Desktop Extension 仕様、ツールチェーン、スキーマをオープンソース化し、他の AI デスクトップアプリケーションでも利用可能にする。企業向けには Group Policy(Windows)や MDM(macOS)サポート、承認済み拡張機能の事前インストール、プライベート拡張機能ディレクトリの展開機能を提供。
出展:Desktop Extensions: One-click MCP server installation for Claude Desktop
Devin、Session UI と Enterprise 機能を大幅改善
日付:2025 年 6 月 26 日
Devin が Session UI と Enterprise 向け機能を大幅にアップデート。ユーザーインターフェースの改善と企業向け管理機能の強化を実施。
Session UI では重要な決定ポイント(Task、Plan、PR、Summary)をより明確に表示するよう改良。セッションの進行状況は引き続き完全にアクセス可能で、より直感的で分かりやすい形で提示される。Enterprise Connected Accounts UI はクリーンで集中的なデザインに再設計され、アカウント接続プロセスが簡素化された。
Enterprise 向けには Git Permissions UI が専用タブに移動し、組織単位でのリポジトリ権限管理が改善。組織ベースでのリポジトリ権限の表示、リポジトリとグループの割り当て・削除がより明確に行えるようになった。
Google Sheets、Gemini AI 関数によるセル内データ生成機能を提供
日付:2025 年 6 月 25 日
Google が Google Sheets で AI 関数を導入し、セル内で Gemini を直接利用したデータ生成が可能になった。スプレッドシートのデータを活用したテキスト生成、要約、分類、感情分析を実行できる。
AI 関数は=AI("プロンプト", データ範囲)
の形式で使用し、テキスト生成では商品の広告コピー作成やレビューへの返信メール作成、要約では顧客フィードバックの一文要約、分類では顧客問い合わせの種別分類や感情分析などが可能。非連続範囲の参照には連結機能を使用し、複数のデータ要素を組み合わせた処理も実行できる。
// テキスト生成例=AI("Write a formal ad copy for the product. Cater copy to the objective and target audience", A2:C2)
// 要約例=AI("For the customer, write a one sentence summary of their feedback.", A2:D2)
// 分類例=AI("Categorize the customer inquiry as a compliment, exchange request, or return request.",C2)
セルまたはプロンプトが更新されると非同期状態を表示し、前の出力を参照用に保持。複数セル選択時は最初の 200 セルまで生成される。Google Workspace Business/Enterprise、Gemini Education、Google AI Pro/Ultra プランで利用可能。
Gemini Code Assist、エージェントモードをプレビュー提供
日付:2025 年 6 月 25 日
Google が Gemini CLI に合わせて Gemini Code Assist のエージェントモード、マルチファイル編集、フルプロジェクトコンテキストをプレビュー版として提供開始。複雑なマルチステップタスクの自動化と大規模なコードベース変更が可能になった。同様のツールと比べて、かなり出遅れたエージェントモードのサポートだが、コンテキスト量に優位性がある。
エージェントモードでは変更前に計画をレビューし、編集・変更要求・承認・拒否を選択できる対話型アプローチを採用。マルチファイル編集機能により、単一のプロンプトでコードベース全体に同時変更を実行でき、大規模リファクタリング、機能実装、バグ修正が効率化される。ローカルファイルの変更を元の状態に戻すオプションも提供。
フルプロジェクトコンテキストにより、エージェントがプロジェクト全体を包括的に理解し、目標に基づいて必要なファイルとフォルダを要求する。プロジェクトのアーキテクチャ、依存関係、コーディングパターンの深い理解により、より正確で一貫性のあるコード補完、提案、リファクタリングを提供。