Gemini 2.5 Flash と Pro、Live API、Veo 2 の一般提供開始
Google は Gemini 2.5 シリーズの新モデルをリリースしました。Gemini 2.5 Pro は、最も高度なコーディングモデルとして、視覚的に魅力的な Web アプリの作成やエージェントプログラミングアプリケーションの開発に優れています。また、Gemini 2.5 Flash は、低レイテンシーとコスト効率を維持しながら、思考能力を組み込んだ進化版として近日公開予定です。これらのモデルは、100 万トークンの入力コンテキストウィンドウを備え、より高度なエージェントの実現やマルチエージェントシステムの管理、コードベース全体の生成的な推論の加速を可能にします。
また Veo 2 が Gemini API で一般提供を開始しました。テキストや画像のプロンプトから高品質な動画を生成でき、720p 解像度で 24 フレーム/秒の 8 秒までの動画クリップを生成できます。さらに Live API for Gemini models がプレビュー版として利用可能になり、ストリーミングオーディオ、ビデオ、テキストを低レイテンシーで処理できるようになりました。30 の新しい言語と 2 つの新しい音声オプション、設定可能な Voice Activity Detection(VAD)、スライディングコンテキストウィンドウによる事実上無限のセッションサポートなどの機能が追加されています。