2145 words
11min read
Edit

AI Weekly 2026-01-22

#Qwen3-TTSファミリーがオープンソース化、音声デザインやクローン機能を提供

日付:2026年01月22日

Alibaba CloudのQwenチームが、音声生成モデル「Qwen3-TTS」ファミリーをオープンソース化した。1.7Bと0.6Bの2サイズを展開し、音声クローン、音声デザイン、テキストからの音声生成など包括的な機能を提供する。

日本語を含む10言語に対応し、独自の12Hzマルチコードブック音声エンコーダにより高効率な圧縮と高忠実度な復元を実現。Dual-Trackモデリングにより、最初の文字処理後すぐに音声パケットを配信する高速なストリーミング生成が可能となっている。GitHubおよびHugging Faceにて公開されている。

Hugging FaceにQwen3-TTS Demoが公開されている。

出展:Qwen3-TTS Family is Now Open Sourced

#Vercelが”Bash is all you need”仮説を検証

日付:2026年01月22日

BraintrustとVercelが、AIエージェントにとってBashとファイルシステムが最適な抽象化であるという仮説を検証した結果を公開した。GitHubのIssueやPRのデータセットを用いた比較実験において、SQLエージェントが精度100%を達成した一方、Bashエージェントは52.7%にとどまる結果となった。

Bashエージェントは高度なシェルコマンドを生成するものの、パフォーマンスのボトルネックやスキーマコンテキストの欠如が課題として浮き彫りになった。一方で、SQLでクエリを実行しBashで結果を検証するハイブリッドアプローチでは、コストは増加するものの高い信頼性を実現できることが示された。構造化データにはSQLが、探索や検証にはBashが適していると結論付けている。

出展:Testing if “bash is all you need”

#Google Antigravity 1.15.6がTerminal Sandboxingをサポート

日付:2026年01月23日

Google Antigravity 1.15.6にて、MacOSユーザー向けにTerminal Sandboxing機能が追加された。これにより、エージェントが実行するターミナルコマンドをサンドボックス内で実行し、ワークスペース外のファイルへの意図しない変更や損害を防ぐことが可能になった。

出展:Google Antigravity Changelog

#Goチームが2025年開発者サーベイ結果を公開、過半数がAIツールを毎日利用

日付:2026年01月21日

Goチームが2025年Go開発者サーベイの結果を公開した。回答者の53%がAI-powered development toolsを毎日利用している一方で、生成コードの品質への懸念から満足度は中程度に留まる傾向が示された。

主な調査結果は以下の通り。

  • AI利用: 53%が毎日利用。利用用途は情報の要約や知識ギャップの補完が主。
  • Editor: VS Code (37%)、GoLand (28%)が主流。新興のZedとCursorが各4%までシェアを拡大。
  • 課題: 機能しないコード(53%)や低品質なコード(30%)の生成が主な不満点。

言語自体の満足度は91%と高く維持されているものの、goコマンドのドキュメント改善やベストプラクティスの普及に課題が残ると報告されている。

出展:Results from the 2025 Go Developer Survey

#Ollamaが画像生成モデルの実行をサポート (experimental)

日付:2026年01月20日

OllamaがmacOS向けに画像生成モデルの実行を実験的にサポートした(Windows/Linuxは近日対応)。ollama run x/z-image-turboのようにコマンドを実行することで、Z-Image TurboやFLUX.2 Kleinといった画像生成モデルをローカルで利用できる。

生成された画像はカレントディレクトリに保存されるほか、GhosttyやiTerm2など画像表示に対応したターミナルではインラインでプレビューが可能となる。利用可能なモデルとして、Alibaba Tongyi LabのZ-Image Turbo (6B)やBlack Forest LabsのFLUX.2 Klein (4B/9B)が挙げられている。

出展:Image generation (experimental)

#VercelがAIエージェント向けスキルエコシステム「Skills.sh」を公開

日付:2026年01月20日

VercelがAIエージェント向けのスキルパッケージマネージャ skills およびディレクトリサイト skills.sh を公開した。npx skills add <package> コマンドを実行するだけで、Cursor、Claude Code、GitHub CopilotなどのAIエージェントに、フレームワークのベストプラクティスや特定のタスク遂行能力(スキル)を追加できる。

Skills.shは「AIエージェントのためのnpm」と位置づけられており、Model Context Protocol (MCP) サーバーとしても機能する。公開時点で20,000以上のインストールを記録しており、vercel-react-best-practicesremotion-best-practices などの公式スキルが提供されている。これにより、エージェントが最新かつ正確な知識に基づいてコード生成やタスク実行を行えるようになる。

出展:Introducing skills, the open agent skills ecosystem

#OpenAIがLLMインターフェース仕様「Open Responses」を発表

日付:2026年01月16日

OpenAIが、マルチプロバイダー対応の相互運用可能なLLMインターフェース構築のためのオープンソース仕様「Open Responses」を発表した。OpenAI Responses APIをベースとしており、モデルプロバイダーごとにスタックを書き直すことなくエージェントシステムの構築が可能になる。

主な特徴:

  • Multi-provider by default:単一のスキーマで多くのモデルプロバイダーに対応
  • Real-world agentic workflows:ストリーミングイベント、Tool use、Item単位の出力などを統一
  • Extensible without fragmentation:プロバイダー固有の機能を許容しつつ安定したCoreを提供

NVIDIA、Vercel、OpenRouter、Hugging Face、LM Studio、Ollama、vLLMなどがコミュニティとして参画している。

出展:Open Responses

#Google検索のAIモードがGmailやGoogle Photosと連携するPersonal Intelligenceを追加

日付:2026年01月22日

Google AI ProおよびAI Ultraのサブスクライバー向けに、Google検索のAIモードがGmailやGoogle Photosと連携する「Personal Intelligence」機能の提供が開始された(Labs実験機能として)。

Gemini 3モデルを使用し、ユーザーのGmailにある旅行計画やGoogle Photosの思い出を参照して、パーソナライズされた検索結果や提案を行うことが可能になる。例えば、旅行の旅程に合わせた服装の提案や、家族向けのプラン作成などができる。プライバシーを重視し、データはモデルの学習には直接使用されない。

出展:Personal Intelligence in AI Mode in Search: Help that’s uniquely yours

#Google Vidsが同期されたアニメーション付きの字幕をサポート

日付:2026年01月22日

Google Vidsが、音声やメディア要素と同期するアニメーション付きの字幕を作成できるようになった。これにより、視覚的なガイドとしての役割を果たし、コンテンツの理解度を高め、視聴者が内容を追いやすくなる。

字幕内のスペルや文法の誤りは編集・修正が可能。現在、日本語、英語、中国語を含む30以上の言語に対応している。

出展:Styled captions in Google Vids

#GitHub Copilot CLIがPlan modeと推論モデルGPT-5.2-Codexを導入

日付:2026年01月21日

GitHub Copilot CLIに、実装前に設計を議論できるPlan modeや、最新のGPT-5.2-Codexモデルが追加された。Plan modeではShift + Tabで対話的に要件定義を行い、実装計画を策定できる。

また、推論の深度を調整可能なGPT-5.2-Codexの利用、/reviewコマンドによるコードレビュー、リポジトリのコンテキストを記憶する機能、/compactによるコンテキスト管理なども導入されている。これにより、ターミナルでの開発体験とAIによる支援が大幅に強化された。

出展:GitHub Copilot CLI: Plan before you build, steer as you go - GitHub Changelog

#OpenAIがChatGPTへの広告導入とアクセス拡大の取り組みを発表

日付:2026年01月16日

OpenAIが、低価格サブスクリプションプラン「ChatGPT Go」の提供地域をChatGPTが利用可能なすべての地域に拡大するとともに、無料版およびChatGPT Goプランでの広告表示テストを開始する計画を発表した。

広告は、ユーザーの会話内容や個人情報に基づいてターゲティングされることはなく、回答生成ロジックにも影響を与えない。広告主へのデータ提供や販売は行わず、パーソナライズ機能もユーザーがオフにできるなど、プライバシーと信頼性の維持が重視されている。Plus、Pro、Business、Enterpriseプランには引き続き広告は表示されない。

出展:広告と ChatGPT へのアクセス拡大に対するOpenAI の取り組み

#CognitionがAIコードレビューツールDevin Reviewを発表

日付:2026年01月21日

Cognitionが、AIを用いたコードレビューツール「Devin Review」を発表した。大規模なPR(Pull Request)の内容をAIが解析し、論理的な変更単位でのグループ化や、チャット形式での対話的な確認、AIによるバグ検出機能を提供する。

State-of-the-artのAIとUXを組み合わせることで、単なるコード生成ではなく、複雑化するコード差分の人間による理解をスケールさせることを目的としている。GitHubのPR URLのgithub部分をdevinreviewに書き換えるか、npx devin-reviewコマンドを実行することで利用できる。

出展:Cognition