All Posts
News bits
Ollamaが画像生成モデルの実行をサポート (experimental)
Ollamaが画像生成モデルの実行をサポート (experimental)
OllamaがmacOS向けに画像生成モデルの実行を実験的にサポートした(Windows/Linuxは近日対応)。ollama run x/z-image-turboのようにコマンドを実行することで、Z-Image TurboやFLUX.2 Kleinといった画像生成モデルをローカルで利用できる。
生成された画像はカレントディレクトリに保存されるほか、GhosttyやiTerm2など画像表示に対応したターミナルではインラインでプレビューが可能となる。利用可能なモデルとして、Alibaba Tongyi LabのZ-Image Turbo (6B)やBlack Forest LabsのFLUX.2 Klein (4B/9B)が挙げられている。
Seedream 4.0、ByteDance製の統合画像AI
Seedream 4.0、ByteDance製の統合画像AI
ByteDanceが画像生成・編集モデル「Seedream 4.0」をリリースした。最大4K解像度での高品質画像生成と画像編集機能を単一の統一アーキテクチャで実現し、マルチモーダルタスクを処理する。
参照画像からの特徴継承生成、ロゴ画像からの複数製品画像生成、複数画像要素の統合など高度な機能を提供。知識ベース生成により方程式解法やアイスクリームレシピの図解も可能で、精密編集では人物削除、文字書き換え、白黒写真のカラー化を実現する。
画像生成ベンチマークでGemini 2.5 (Nano Banana)を全テストで上回り、一部テストでGPT Image 1を超えるスコアを記録。画像編集性能でも多くのテストで最高スコアを獲得し、falやComfyUIなどの複数プラットフォームで利用可能。
出展:Seedream 4.0
GoogleがGemini 2.5 Flash Imageを公開、高速画像生成に対応
GoogleがGemini 2.5 Flash Imageを公開、高速画像生成に対応
GoogleがGemini 2.5 Flash Imageを公開。このモデルは発表以前からnano-bananaとして話題になっていた強力な一貫性の維持が可能な画像生成・編集モデル。Geminiアプリの他、APIでの利用も可能。
Gemini 2.5 Flash Imageのベストプラクティスについての記事も公開されている。
個人的に試した感想として、他の画像生成・編集モデルとは以下の点で大きく異なるように感じた。
- 一貫性の維持が非常に強力であり、画像編集に利用する場合は詳細に記述する必要がある。
- 画像の位置を指定した編集が可能。
- 入力画像のアスペクト比が維持される。アスペクト比を指定した生成が可能。
- 画質をコントロール可能。指定しない場合、画質が低くなるケースが多い。
また、ComfyUIが即日nano-bananaをネイティブサポートした。
出展: Introducing Gemini 2.5 Flash Image - Google Developers Blog
著者について
Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.
In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.
In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.
In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.
I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.