AI Weekly 2025-08-14 - hrdtbs' blog

Claude Sonnet 4が100万トークンのコンテキストをサポート#

日付：2025年8月13日

Anthropic APIで、Claude Sonnet 4が最大100万トークンのコンテキストをサポート開始。これは従来の5倍に増加し、75,000行以上のコードベースや数十の研究論文を単一のリクエストで処理可能。この機能はAnthropic APIとAmazon Bedrockでパブリックベータとして利用でき、Google CloudのVertex AIでも近日提供予定。

コンテキスト長の拡大により、以下のユースケースに対応する。

大規模なコード解析: コードベース全体を読み込み、プロジェクトアーキテクチャを理解し、ファイル間の依存関係を特定。
ドキュメントの統合: 法的契約書や研究論文などの広範なドキュメントセットを処理し、複数ドキュメント間の関係を分析。
コンテキストを認識するエージェント: 複数ステップのワークフローにわたってコンテキストを維持するエージェントを構築。

200Kトークンを超えるプロンプトは価格が異なる。

200Kトークン以下のプロンプト
- Input: $3 / MTok
- Output: $15 / MTok
200Kトークンを超えるプロンプト
- Input: $6 / MTok
- Output: $22.50 / MTok

prompt cachingやbatch processingとの併用で、さらなるコスト削減が可能。

出展：Claude Sonnet 4 now supports 1M tokens of context - Anthropic

Cursor、TeamsプランとAutoの料金モデルを更新#

日付：2025年8月12日

Cursorが、Teamsプランと個人向けAuto機能に関する料金モデルの更新を発表。この変更は、月額および年額プランにおいて、2025年9月15日以降の次回請求更新時から適用される。

Teamsプランの変更点: エージェント利用料金が、固定リクエストコストから変動リクエストコストへ移行。リクエストの複雑さに応じてコストが変動し、単純な質問は低コストに、PRの実装のような複雑なタスクは高コストになる。
個人向けAutoの変更点: これまで無制限だった利用が、月間使用量に加算される形式に変更。競争力のある（他サービスと同等かそれより安い）トークンレートで課金される。

今回の更新により、個人向けプランで既に採用されている変動クレジットシステムがTeamsプランにも導入され、全階層で請求システムが統一される。

出展：Updates to Teams and Auto | Cursor

GoogleスライドとGoogle VidsにAI画像編集機能が追加、背景の置換や拡張が可能に#

日付：2025年8月13日

GoogleスライドとGoogle Vidsに、AIを活用した2つの画像編集機能が導入された。これにより、画像の背景置換と背景拡張が可能になる。この機能は、デザインスキルがないユーザーでも画像のニーズを満たし、プレゼンテーションの柔軟性と専門性を向上させることを目的としている。

背景の置換 (Replace background): 画像を選択し、「画像を生成」から「背景を置換」を選び、プロンプトを入力するだけで背景を置き換える。製品写真を様々な環境に配置したり、チーム写真の背景を統一したりする用途で利用できる。
背景の拡張 (Expand background): 画像の品質を損なうことなく、背景をインテリジェントに拡張し、リサイズや再フレーミングを容易にする。小さな画像をプレゼンテーションに合わせて大きくする場合に役立つ。

本機能は、Google WorkspaceのBusiness Standard、Business Plus、Enterprise Standard、Enterprise Plusエディション、Gemini EducationおよびGemini Education Premiumアドオン、ならびにGoogle AI ProとGoogle AI Ultraで利用できる。

出展：Adding AI image editing features to Google Slides and Google Vids

ComfyUI、動画生成モデルWan2.2 Fun ControlとFun InPをネイティブサポート#

日付：2025年8月13日

ComfyUIが、Alibaba PAIチームが開発した動画生成モデルWan2.2 Fun ControlおよびWan2.2 Fun InPをネイティブでサポートした。同時に、動画生成を高速化するLightX2V Wan2.2 Lightning LoRAも統合。両モデルはApache 2.0ライセンスでリリースされており、商用利用が可能。

Wan2.2 Fun InP: 最初と最後のフレームを指定することで、その間の滑らかな遷移を持つ動画を生成するモデル。
Wan2.2 Fun Control: ポーズ、深度、Cannyエッジ、軌跡など、複数のモダリティで動画生成を精密に制御するモデル。
LightX2V 4 Steps LoRA: Wan2.2モデルに適用可能なLoRAで、動画生成速度を大幅に向上させる。品質はわずかに低下するものの、VRAMが少ないGPUでの利便性が向上。

RTX 4090D (24GB) 環境で640x640px、81フレームの動画を生成した場合、LoRAの使用により生成時間は177.3秒から48.7秒へと短縮される。

利用方法は、ComfyUIをダウンロードまたはアップデート後、WorkflowsメニューのBrowse TemplatesからVideoセクションに進み、Wan2.2 14B Fun InPまたはWan2.2 14B Fun Controlのテンプレートを選択する。プロンプトに従い、必要なモデルファイルをダウンロードして使用できる。

出展：ComfyUI Wan2.2 Fun Native Support and LightX2V 4-Step LoRA Integration

参考：

Gemini CLIがVS Codeとの連携を強化、差分表示やコンテキスト認識に対応#

日付：2025年8月13日

Gemini CLIの最新アップデートにより、VS Codeの統合ターミナルとの連携機能が強化された。このIDE統合によって、Gemini CLIが開発者の作業コンテキストを理解し、提案をエディタ内で直接差分表示することが可能になる。

主な新機能は以下の通り。

Workspace & selection context: Gemini CLIがVS Codeのワークスペース、開いているファイル、選択中のテキストに直接アクセスし、作業状況に応じた的確な提案を行う。
Native in-editor diffing: Gemini CLIからの提案がVS Code内で全画面の差分ビューとして表示される。このビュー上で直接コードを編集し、適用前に変更を修正できる。

この機能を利用するには、Gemini CLI v0.1.20以上が必要。VS Codeの統合ターミナルから/ide installコマンドでコンパニオン拡張機能を一度だけインストールし、/ide enableで連携を有効化する。無効化する場合は/ide disableを使用する。

出展：Gemini CLI + VS Code: Native diffing and context-aware workflows