AI Weekly 2025-09-11
Google AIモード検索が日本語対応開始
日付:2025年9月9日
Google検索の「AIモード」の日本語対応を開始。Gemini 2.5のカスタムバージョンを使用し、従来の2-3倍の長さの複雑な質問に回答する。
マルチモーダルに対応し、テキスト・音声・画像での質問が可能。 また、Googleの複数の特許に依存したQuery Fan-out技術を使用し、複雑な質問をサブトピックに分解し、複数のサブクエリで検索実行することで網羅的な回答が得られる。
Stable Audio 2.5、エンタープライズ向け音楽生成AI
日付:2025年9月10日
Stability AIがエンタープライズ向け音楽生成AI「Stable Audio 2.5」をリリース。ARC方式による高速推論で3分間のトラックを2秒未満で生成し、商業レベルの高品質音楽を短時間で作成可能。
またイントロ・展開・アウトロの多部構成に対応した音楽構造改善、既存音声の継続・リミックスが可能なオーディオインペインティング機能、高度なコンテンツ認識技術による著作権侵害チェック機能を搭載している。
さらに、エンタープライズ向けのファインチューニングにも対応しており、組織の音響ライブラリに基づいたカスタマイズが可能。
StableAudio.comで直接利用可能で、Stability AI API、fal、Replicate、ComfyUIでも利用可能。
Claudeがファイル作成・編集機能を追加
日付:2025年9月9日
AnthropicがClaude.aiとデスクトップアプリでファイル作成・編集機能を追加した。Excel、Word、PowerPoint、PDFファイルの直接作成が可能になり、テキスト応答だけでなく実際に使用可能なファイルを生成する。
プライベートな環境でコード記述・実行を行い、データ分析からスプレッドシート構築、クロスフォーマット変換まで対応。
Max、Team、Enterpriseプランでプレビュー提供中で、Proプランは数週間以内に提供予定。Settings > Features > Experimental
で機能を有効化し、完成ファイルのダウンロードまたはGoogle Driveに直接保存が可能。
Cloudflare Workers AIでEmbeddingGemmaを提供開始
日付:2025年9月5日
CloudflareがWorkers AIでEmbeddingGemmaの提供を開始。Googleとのローンチパートナーとして協力し、サイズに対して最高クラスの性能を提供する埋め込みモデルを利用可能にした。
300Mパラメータの埋め込みモデルで、100以上の言語をサポートする多言語対応。RAGシステム、セマンティック検索、コンテンツ分類、クラスタリングタスクに最適化されており、AutoRAGで直接利用可能。
@cf/google/embeddinggemma-300m
を埋め込みモデルとして選択することで、グローバルアプリケーションでの多言語コンテンツ検索と高精度な検索結果を実現できる。
出展:Introducing EmbeddingGemma from Google on Workers AI - Cloudflare Changelog
NotebookLMがクイズやフラッシュカード生成に対応
日付:2025年9月
GoogleがWorkspaceでNotebookLMの教育機能を拡張。フラッシュカード、クイズ、レポート生成機能を追加し、教育現場でのAI活用を促進するソリューションを提供する。
学習内容から自動的にフラッシュカードとクイズを生成し、理解度をテストする機能を搭載。構造化されたレポートの自動作成により、教育者の教材作成を支援し、学生の学習効率向上を実現する。教育者向けの専用テンプレートも提供され、多様な学習スタイルへの対応とアクセシビリティの向上を図っている。
出展:Flashcards, quizzes, and reports in NotebookLM - Google Workspace Updates
Devinが統合ページを全ユーザーに開放
日付:2025年9月12日
Devinが統合ページへのアクセスを全ユーザーに開放した。以前は特定の管理権限が必要だった制限を撤廃し、基本的なDevin使用権限があれば統合ページを閲覧可能になった。
全ユーザーが有効な統合を確認できるようになり、チーム内での統合利用状況の透明性が向上。統合の管理には引き続き管理者権限が必要だが、ユーザビリティが大幅に改善された。
Devin DeepWikiにエクスポート機能が追加
日付:2025年9月5日
DevinがDeepWikiにMarkdownエクスポート機能を追加した。Q&Aスレッドを完全なMarkdown形式でエクスポート可能になり、インライン引用マーカーと適切なMarkdownフォーマットを保持する。
知識ベースの外部共有とドキュメント化が容易になり、チーム間での知識共有が促進される。ヘッダーに新しいエクスポートボタンが追加され、ワンクリックでエクスポートが実行できる。
Google Veo 3が価格大幅値下げ、縦向き動画と1080p HD出力対応
日付:2025年9月8日
GoogleがVeo 3とVeo 3 Fastの価格を大幅に値下げ。また縦向き動画(9<16アスペクト比>16アスペクト比>)と1080p HD出力に対応し、モバイル・ソーシャル用途に最適化。
価格変更:
- Veo 3: 0.40/秒(約47%値下げ)
- Veo 3 Fast: 0.15/秒(約63%値下げ)
Gemini Batch APIが埋め込みとOpenAI互換性をサポート
日付:2025年9月10日
GoogleがGemini Batch APIで埋め込みモデルとOpenAI互換性をサポートした。新しくリリースされたGemini Embeddingモデルに対応し、非同期処理で50%低い料金での高ボリューム処理が可能になった。
埋め込み処理は$0.075/100万入力トークン(通常価格の50%)で提供され、より高いレート制限での大量処理を実現。
from google import genai
client = genai.Client()uploaded_batch_requests = client.files.upload(file='embedding_requests.jsonl')batch_job = client.batches.create_embeddings( model="gemini-embedding-001", src={"file_name": uploaded_batch_requests.name})
またOpenAI SDKを使用してGemini Batch APIを利用でき、既存のOpenAIコードを最小限の変更でGeminiに移行可能。
from openai import OpenAI
openai_client = OpenAI( api_key="GEMINI_API_KEY", base_url="https://generativelanguage.googleapis.com/v1beta/openai/")
batch = openai_client.batches.create( input_file_id=batch_input_file_id, endpoint="/v1/chat/completions", completion_window="24h")
出展:Gemini Batch API now supports Embeddings and OpenAI Compatibility - Google Developers Blog
Genkit Go 1.0、Google製AIフレームワーク
日付:2025年9月9日
GoogleがGo言語のAI開発フレームワーク「Genkit Go 1.0」を正式リリースした。
Genkit GoはGo構造体とJSONスキーマ検証による型安全性を提供し、Google AI、OpenAI、Anthropic、Ollamaなど複数のAIプロバイダーを統一されたAPIで利用可能。ツール呼び出し、RAG、マルチモーダルコンテンツ対応など高度なAI機能をサポートする。
recipeFlow := genkit.DefineFlow(g, "recipeGeneratorFlow", func(ctx context.Context, input *RecipeInput) (*Recipe, error) { recipe, _, err := genkit.GenerateData[Recipe](ctx, g, ai.WithPrompt(prompt), ) return recipe, nil })
またgenkit init:ai-tools
コマンドにより、Gemini CLI、Claude Code、Cursorなど複数のAIコーディングアシスタントとの統合を自動化。スタンドアロンCLIバイナリとインタラクティブなDeveloper UIにより、開発効率を向上させる。
出展:Announcing Genkit Go 1.0 and Enhanced AI-Assisted Development - Google Developers Blog
VS Code 1.104リリース
日付:2025年9月11日
Visual Studio Code 1.104がリリースされた。AI開発体験を中心としたアップデートが実施された。
出展:August 2025 (version 1.104) - Visual Studio Code Updates
最適なモデルの自動選択
VS Codeが最適なモデルを自動選択する「Auto」機能をプレビュー提供。Claude Sonnet 4、GPT-5、GPT-5 mini、GPT-4.1から最適なモデルを自動選択し、パフォーマンスとレート制限を最適化する。有料ユーザーには10%のリクエスト割引を適用し、組織の設定に応じてモデル選択を制御可能。
AGENTS.mdファイルのサポート
ワークスペースルートのAGENTS.md
ファイルを自動的にチャットコンテキストとして取得する機能を実験的に提供。chat.useAgentsMdFile
で有効化可能。
AIによるコマンドの実行許可
ターミナルコマンドの自動承認が改善された。chat.tools.terminal.enableAutoApprove
で有効化可能。またchat.tools.terminal.autoApprove
でコマンド毎に設定できる。
AIによる機密ファイルの編集確認
エージェントモードで機密ファイルの編集前にユーザー確認を要求する機能を追加。
chat.tools.edits.autoApprove
で確認が必要なファイルパターンを構成可能。
Qwen3-Next、コスト効率の良いモデル
日付:2025年9月11日
AlibabaのAI研究チームがコストパフォーマンスの高いAIモデル「Qwen3-Next」を無料公開した。従来モデルと比べて10分の1以下のコストでトレーニングされながら、入力トークンが多い状況では10倍以上高速な推論処理を実現する。
Qwen3-Next-80B-A3B-BaseはMixture of Experts (MoE)アーキテクチャを採用し、800億パラメータのモデルで実際の推論では最大30億パラメータのみがアクティブになる。Gated DeltaNetとGated Attentionを3:1の割合で用いることで性能の高さとトレーニングコストの低さを両立している。
入力トークン数3万2000の場合、最初のトークンを出力するまでのスピードはQwen3-32Bと比べて10.6倍高速で、それ以降の出力速度は10倍高速。一部のベンチマークテストでGoogleのGemini-2.5-Flash-Thinkingを上回る性能を示し、Hugging Faceで商用利用可能な形で無料公開されている。
出展:Qwen3-Next: Towards Ultimate Training & Inference Efficiency
Seedream 4.0、ByteDance製の統合画像AI
日付:2025年9月11日
ByteDanceが画像生成・編集モデル「Seedream 4.0」をリリースした。最大4K解像度での高品質画像生成と画像編集機能を単一の統一アーキテクチャで実現し、マルチモーダルタスクを処理する。
参照画像からの特徴継承生成、ロゴ画像からの複数製品画像生成、複数画像要素の統合など高度な機能を提供。知識ベース生成により方程式解法やアイスクリームレシピの図解も可能で、精密編集では人物削除、文字書き換え、白黒写真のカラー化を実現する。
画像生成ベンチマークでGemini 2.5 (Nano Banana)を全テストで上回り、一部テストでGPT Image 1を超えるスコアを記録。画像編集性能でも多くのテストで最高スコアを獲得し、falやComfyUIなどの複数プラットフォームで利用可能。
出展:Seedream 4.0