All Posts
News bits
Qwen3-TTSファミリーがオープンソース化、音声デザインやクローン機能を提供
Qwen3-TTSファミリーがオープンソース化、音声デザインやクローン機能を提供
Alibaba CloudのQwenチームが、音声生成モデル「Qwen3-TTS」ファミリーをオープンソース化した。1.7Bと0.6Bの2サイズを展開し、音声クローン、音声デザイン、テキストからの音声生成など包括的な機能を提供する。
日本語を含む10言語に対応し、独自の12Hzマルチコードブック音声エンコーダにより高効率な圧縮と高忠実度な復元を実現。Dual-Trackモデリングにより、最初の文字処理後すぐに音声パケットを配信する高速なストリーミング生成が可能となっている。GitHubおよびHugging Faceにて公開されている。
Hugging FaceにQwen3-TTS Demoが公開されている。
著者について
Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.
In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.
In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.
In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.
I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.