GoogleがGemini 2.5 Flash Imageを公開、高速画像生成に対応
GoogleがGemini 2.5 Flash Imageを公開。このモデルは発表以前からnano-bananaとして話題になっていた強力な一貫性の維持が可能な画像生成・編集モデル。Geminiアプリの他、APIでの利用も可能。
Gemini 2.5 Flash Imageのベストプラクティスについての記事も公開されている。
個人的に試した感想として、他の画像生成・編集モデルとは以下の点で大きく異なるように感じた。
- 一貫性の維持が非常に強力であり、画像編集に利用する場合は詳細に記述する必要がある。
- 画像の位置を指定した編集が可能。
- 入力画像のアスペクト比が維持される。アスペクト比を指定した生成が可能。
- 画質をコントロール可能。指定しない場合、画質が低くなるケースが多い。
また、ComfyUIが即日nano-bananaをネイティブサポートした。
出展: Introducing Gemini 2.5 Flash Image - Google Developers Blog