AI Weekly 2025-08-14
Claude Sonnet 4が100万トークンのコンテキストをサポート
日付:2025年8月13日
Anthropic APIで、Claude Sonnet 4が最大100万トークンのコンテキストをサポート開始。これは従来の5倍に増加し、75,000行以上のコードベースや数十の研究論文を単一のリクエストで処理可能。この機能はAnthropic APIとAmazon Bedrockでパブリックベータとして利用でき、Google CloudのVertex AIでも近日提供予定。
コンテキスト長の拡大により、以下のユースケースに対応する。
- 大規模なコード解析: コードベース全体を読み込み、プロジェクトアーキテクチャを理解し、ファイル間の依存関係を特定。
- ドキュメントの統合: 法的契約書や研究論文などの広範なドキュメントセットを処理し、複数ドキュメント間の関係を分析。
- コンテキストを認識するエージェント: 複数ステップのワークフローにわたってコンテキストを維持するエージェントを構築。
200Kトークンを超えるプロンプトは価格が異なる。
- 200Kトークン以下のプロンプト
- Input: $3 / MTok
- Output: $15 / MTok
- 200Kトークンを超えるプロンプト
- Input: $6 / MTok
- Output: $22.50 / MTok
prompt caching
やbatch processing
との併用で、さらなるコスト削減が可能。
出展:Claude Sonnet 4 now supports 1M tokens of context - Anthropic
Cursor、TeamsプランとAutoの料金モデルを更新
日付:2025年8月12日
Cursorが、Teamsプランと個人向けAuto機能に関する料金モデルの更新を発表。この変更は、月額および年額プランにおいて、2025年9月15日以降の次回請求更新時から適用される。
- Teamsプランの変更点: エージェント利用料金が、固定リクエストコストから変動リクエストコストへ移行。リクエストの複雑さに応じてコストが変動し、単純な質問は低コストに、PRの実装のような複雑なタスクは高コストになる。
- 個人向けAutoの変更点: これまで無制限だった利用が、月間使用量に加算される形式に変更。競争力のある(他サービスと同等かそれより安い)トークンレートで課金される。
今回の更新により、個人向けプランで既に採用されている変動クレジットシステムがTeamsプランにも導入され、全階層で請求システムが統一される。
GoogleスライドとGoogle VidsにAI画像編集機能が追加、背景の置換や拡張が可能に
日付:2025年8月13日
GoogleスライドとGoogle Vidsに、AIを活用した2つの画像編集機能が導入された。これにより、画像の背景置換と背景拡張が可能になる。この機能は、デザインスキルがないユーザーでも画像のニーズを満たし、プレゼンテーションの柔軟性と専門性を向上させることを目的としている。
- 背景の置換 (Replace background): 画像を選択し、「画像を生成」から「背景を置換」を選び、プロンプトを入力するだけで背景を置き換える。製品写真を様々な環境に配置したり、チーム写真の背景を統一したりする用途で利用できる。
- 背景の拡張 (Expand background): 画像の品質を損なうことなく、背景をインテリジェントに拡張し、リサイズや再フレーミングを容易にする。小さな画像をプレゼンテーションに合わせて大きくする場合に役立つ。
本機能は、Google WorkspaceのBusiness Standard、Business Plus、Enterprise Standard、Enterprise Plusエディション、Gemini EducationおよびGemini Education Premiumアドオン、ならびにGoogle AI ProとGoogle AI Ultraで利用できる。
出展:Adding AI image editing features to Google Slides and Google Vids
ComfyUI、動画生成モデルWan2.2 Fun ControlとFun InPをネイティブサポート
日付:2025年8月13日
ComfyUIが、Alibaba PAIチームが開発した動画生成モデルWan2.2 Fun Control
およびWan2.2 Fun InP
をネイティブでサポートした。同時に、動画生成を高速化するLightX2V Wan2.2 Lightning LoRA
も統合。両モデルはApache 2.0ライセンスでリリースされており、商用利用が可能。
- Wan2.2 Fun InP: 最初と最後のフレームを指定することで、その間の滑らかな遷移を持つ動画を生成するモデル。
- Wan2.2 Fun Control: ポーズ、深度、Cannyエッジ、軌跡など、複数のモダリティで動画生成を精密に制御するモデル。
- LightX2V 4 Steps LoRA:
Wan2.2
モデルに適用可能なLoRAで、動画生成速度を大幅に向上させる。品質はわずかに低下するものの、VRAMが少ないGPUでの利便性が向上。
RTX 4090D (24GB) 環境で640x640px、81フレームの動画を生成した場合、LoRAの使用により生成時間は177.3秒から48.7秒へと短縮される。
利用方法は、ComfyUIをダウンロードまたはアップデート後、Workflows
メニューのBrowse Templates
からVideo
セクションに進み、Wan2.2 14B Fun InP
またはWan2.2 14B Fun Control
のテンプレートを選択する。プロンプトに従い、必要なモデルファイルをダウンロードして使用できる。
出展:ComfyUI Wan2.2 Fun Native Support and LightX2V 4-Step LoRA Integration
参考:
Gemini CLIがVS Codeとの連携を強化、差分表示やコンテキスト認識に対応
日付:2025年8月13日
Gemini CLIの最新アップデートにより、VS Codeの統合ターミナルとの連携機能が強化された。このIDE統合によって、Gemini CLIが開発者の作業コンテキストを理解し、提案をエディタ内で直接差分表示することが可能になる。
主な新機能は以下の通り。
- Workspace & selection context: Gemini CLIがVS Codeのワークスペース、開いているファイル、選択中のテキストに直接アクセスし、作業状況に応じた的確な提案を行う。
- Native in-editor diffing: Gemini CLIからの提案がVS Code内で全画面の差分ビューとして表示される。このビュー上で直接コードを編集し、適用前に変更を修正できる。
この機能を利用するには、Gemini CLI v0.1.20以上が必要。VS Codeの統合ターミナルから/ide install
コマンドでコンパニオン拡張機能を一度だけインストールし、/ide enable
で連携を有効化する。無効化する場合は/ide disable
を使用する。
出展:Gemini CLI + VS Code: Native diffing and context-aware workflows