All Posts
News bits
Veo 3、Imagen 4、Flow など最新メディア生成モデルが発表
Veo 3、Imagen 4、Flow など最新メディア生成モデルが発表
Google が I/O 2025 で最新のメディア生成モデルが発表。Veo 3 は初の音声付き動画生成を実現し、Imagen 4 は 2K 解像度での高品質画像生成が可能。新しい AI 映像制作ツール Flow や音楽生成の Lyria 2 も発表され、クリエイティブ業界向けの包括的なソリューションを提供。全てのコンテンツに SynthID による電子透かしを付与し、AI 生成コンテンツの識別を支援する SynthID Detector も公開。
Veo 3:音声付き動画生成を初実現。街中の交通音、鳥のさえずり、キャラクター対話なども生成可能。リップシンクや物理法則を正確に反映し、米国の Ultra ユーザー、Gemini アプリ、Flow、Vertex AI で利用開始。
Veo 2 新機能:参照画像による動画生成、カメラコントロール(回転・ズーム設定)、アウトペインティング(フレーム拡張)、オブジェクトの追加・削除機能を追加。
Flow:Veo 向け AI 映像制作ツール。キャラクター、シーン、スタイルの細かい制御で映画のような作品を制作可能。
Imagen 4:最大 2K 解像度での高品質画像生成、文字表現・タイポグラフィ機能が大幅向上。Gemini アプリ、Whisk、Vertex AI、Google Workspace で利用可能。近日中に Imagen 3 比で最大 10 倍高速な版をリリース予定。
Lyria 2:Music AI Sandbox での高度な楽曲制作ツール。Lyria RealTime によるリアルタイム音楽生成も API 経由と AI Studio で提供。
SynthID Detector:AI 生成コンテンツ識別を支援する検証ポータルサイトを公開。SynthID による電子透かしの有無を確認可能。
著者について
Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.
In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.
In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.
In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.
I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.