編集

Gemini 2.5 の暗黙的なキャッシュ

Google が Gemini 2.5 モデルで implicit caching を導入。これにより、明示的なキャッシュ設定を行わなくても、リクエストの先頭部分が過去のリクエストと共通していれば自動的にコストが削減される。2.5 Flash は 1024 トークン、2.5 Pro は 2048 トークンからキャッシュ対象となり、usage metadata にはcached_content_token_countが追加された。明示的キャッシュ API も引き続き利用できる。

#参考文献

編集