メインコンテンツへスキップ

All Posts

News bits

Ollamaが画像生成モデルの実行をサポート (experimental)

OllamaがmacOS向けに画像生成モデルの実行を実験的にサポートした(Windows/Linuxは近日対応)。ollama run x/z-image-turboのようにコマンドを実行することで、Z-Image TurboやFLUX.2 Kleinといった画像生成モデルをローカルで利用できる。

生成された画像はカレントディレクトリに保存されるほか、GhosttyやiTerm2など画像表示に対応したターミナルではインラインでプレビューが可能となる。利用可能なモデルとして、Alibaba Tongyi LabのZ-Image Turbo (6B)やBlack Forest LabsのFLUX.2 Klein (4B/9B)が挙げられている。

出展:Image generation (experimental)

Seedream 4.0、ByteDance製の統合画像AI

ByteDanceが画像生成・編集モデル「Seedream 4.0」をリリースした。最大4K解像度での高品質画像生成と画像編集機能を単一の統一アーキテクチャで実現し、マルチモーダルタスクを処理する。

参照画像からの特徴継承生成、ロゴ画像からの複数製品画像生成、複数画像要素の統合など高度な機能を提供。知識ベース生成により方程式解法やアイスクリームレシピの図解も可能で、精密編集では人物削除、文字書き換え、白黒写真のカラー化を実現する。

画像生成ベンチマークでGemini 2.5 (Nano Banana)を全テストで上回り、一部テストでGPT Image 1を超えるスコアを記録。画像編集性能でも多くのテストで最高スコアを獲得し、falやComfyUIなどの複数プラットフォームで利用可能。

出展:Seedream 4.0

参考:Seedream 4.0 User Guide

GoogleがGemini 2.5 Flash Imageを公開、高速画像生成に対応

GoogleがGemini 2.5 Flash Imageを公開。このモデルは発表以前からnano-bananaとして話題になっていた強力な一貫性の維持が可能な画像生成・編集モデル。Geminiアプリの他、APIでの利用も可能。

Gemini 2.5 Flash Imageのベストプラクティスについての記事も公開されている。

個人的に試した感想として、他の画像生成・編集モデルとは以下の点で大きく異なるように感じた。

  • 一貫性の維持が非常に強力であり、画像編集に利用する場合は詳細に記述する必要がある。
  • 画像の位置を指定した編集が可能。
  • 入力画像のアスペクト比が維持される。アスペクト比を指定した生成が可能。
  • 画質をコントロール可能。指定しない場合、画質が低くなるケースが多い。

また、ComfyUIが即日nano-bananaをネイティブサポートした。

出展: Introducing Gemini 2.5 Flash Image - Google Developers Blog

著者について

Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.

In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.

In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.

In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.

I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.