おすすめ
公開日:

ComfyUIでQwen-Image-Editを試した結果をまとめる。 ComfyUIが提供するテンプレートが良く出来ており、Lightingもすぐに導入できるようになっている。オブジェクトの追加・削除・変更などは安定して出来たが、スタイルの変更やテキストの編集には一部難があるように感じた。

All Posts

News bits

OpenAI と Amazon Bedrock、モデル・Codex・Managed Agents を限定プレビューで提供
AI
OpenAI
Read Article

OpenAI と Amazon Bedrock、モデル・Codex・Managed Agents を限定プレビューで提供

OpenAI と AWS が戦略的パートナーシップを拡大し、AWS 環境で OpenAI のモデル API、Codex、Amazon Bedrock Managed Agents(OpenAI 提供)を限定プレビューとして提供する。企業は既存の調達・セキュリティ・課金の枠組みのままフロンティアモデルやエージェント基盤を試せる。

hrdtbs
hrdtbs 4月28日
2 min read
ams-scanner 0.1.0
AI
ams-scanner
Read Article

ams-scanner 0.1.0

オープンウェイト向けに、有害プロンプトを送らず中間層の活性パターンから安全訓練の残存を測る CLI とライブラリがソースで公開され、続いて PyPI にも載った。Apache 2.0。

hrdtbs
hrdtbs 4月27日
3 min read
GPT-5.5
AI
OpenAI
Read Article

GPT-5.5

OpenAI が GPT-5.5 と GPT-5.5 Pro を ChatGPT および Codex に展開し、API でも近日利用予定とした。併せて同モデルの安全性評価の範囲を System Card として要約する。

hrdtbs
hrdtbs 4月23日
3 min read
Ask Gemini in Drive、一般提供
AI
Ask Gemini
Read Article

Ask Gemini in Drive、一般提供

Workspace・Google AI の対象プラン向けに、Drive 上の Ask Gemini および Drive projects、会話の継続を含む一連の機能が一般提供に移行し、リリース形態と言語に応じた段階的ロールアウトで提供される。

hrdtbs
hrdtbs 4月22日
2 min read
ChatGPT、Fast answersを展開
AI
ChatGPT
Read Article

ChatGPT、Fast answersを展開

一般的情報を求める短いやり取り向けに、高信頼度の答えをより速く返す「Fast answers」を展開。過去会話とメモリは参照せず、ウェブとモバイルの全世界利用者向け。Personalization からオフ可能。

hrdtbs
hrdtbs 4月22日
1 min read
DeepSeek V4
AI
DeepSeek
Read Article

DeepSeek V4

DeepSeek が V4 系 MoE 言語モデル(Flash と Pro)のプレビューを公開し、百万トークン窓と API・オープンウェイト配布をそろえた。ハイブリッド注意とポストトレーニング手順を主な技術軸として説明している。

hrdtbs
hrdtbs 4月22日
3 min read
Responses API、WebSocket 接続
AI
OpenAI
Read Article

Responses API、WebSocket 接続

OpenAI が Responses API に WebSocket 接続方式を導入し、エージェント的な多段リクエストの累積遅延を抑えた。既存の `response.create` ボディを維持しつつ、接続スコープで状態を再利用する設計としている。

hrdtbs
hrdtbs 4月22日
2 min read
VS Code v1.117
AI
VS Code
Read Article

VS Code v1.117

Copilot Business と Enterprise でチャットに独自 API キー(BYOK)を接続でき、ブロック単位のインクリメンタル描画やエージェントセッションの並び替え、ターミナル上の Copilot CLI 起動不具合の修正を含む。TypeScript 6.0.3 を同梱する。

hrdtbs
hrdtbs 4月22日
2 min read
ChatGPT Images 2.0
AI
ChatGPT
Read Article

ChatGPT Images 2.0

ChatGPT向けの新しい画像生成モデルが全プランで使えるようになった。有料プランではThinkingまたはProのモデル選択時に、生成前の計画と精緻化を行うimages with thinkingが利用できる。

hrdtbs
hrdtbs 4月21日
1 min read
Gemini in Chrome、日本向け提供を開始
AI
Gemini
Read Article

Gemini in Chrome、日本向け提供を開始

Google が Chrome に組み込む Gemini in Chrome を、日本国内の Mac・Windows・Chromebook Plus のデスクトップ利用者向けに順次有効化する。Gemini 3.1 を用い、サイドパネルから要約・複数タブの整理・Google 各サービス連携や Nano Banana 2 による画像変換に対応する。

hrdtbs
hrdtbs 4月21日
2 min read
A2UI 0.9
AI
A2UI
Read Article

A2UI 0.9

エージェントが既存のデザインシステム上で UI 意図をストリーミング記述するためのフレームワーク非依存フォーマットが 0.9 に更新され、Web 向け共有コア、公式 React レンダラ、Python 向け Agent SDK、トランスポート周りの整理が入った。

hrdtbs
hrdtbs 4月17日
2 min read
Claude Design
AI
Claude
Read Article

Claude Design

Anthropic Labs が Claude Design を研究プレビューで公開した。Claude Opus 4.7 を基盤にし、プロトタイプやスライドなどの視覚成果物を会話と細かな編集で仕上げ、Claude Code への引き渡しも用意している。

hrdtbs
hrdtbs 4月17日
2 min read
Copilot CLI、auto model selection を一般提供
AI
GitHub Copilot
Read Article

Copilot CLI、auto model selection を一般提供

すべての Copilot プランで GitHub Copilot CLI から Copilot auto model selection を使えるようになった。利用者のプランと管理者ポリシーに応じてモデルを動的に切り替え、プレミアムリクエストは選択されたモデルの倍率に基づいて消費される。

hrdtbs
hrdtbs 4月17日
1 min read
Claude Opus 4.7
AI
Claude
Read Article

Claude Opus 4.7

Anthropic が Claude Opus 4.7 を一般提供し、API では claude-opus-4-7 が利用可能になった。高度なソフトウェア工学や視覚タスクの改善に加え、サイバー悪用を検知して遮断するガードや正当なセキュリティ用途向けの検証プログラムが案内されている。

hrdtbs
hrdtbs 4月16日
3 min read
Gemini app for macOS
AI
Gemini
Read Article

Gemini app for macOS

Google が macOS 向けの Gemini デスクトップアプリを提供する。グローバルショートカットやウィンドウ共有による文脈付きの支援を、ブラウザを開かずに呼び出せる。

hrdtbs
hrdtbs 4月16日
1 min read
OpenAI Codex、デスクトップ向け大規模更新
AI
OpenAI
Read Article

OpenAI Codex、デスクトップ向け大規模更新

ChatGPT にサインインした Codex デスクトップアプリ利用者向けに、Mac 上のバックグラウンド操作、アプリ内ブラウザー、gpt-image-1.5 による画像生成、プラグイン拡充、SSH 接続やメモリのプレビューなどを順次提供する。

hrdtbs
hrdtbs 4月16日
3 min read
Google AI Studio、Gemini API のプリペイド課金
AI
Gemini
Read Article

Google AI Studio、Gemini API のプリペイド課金

Google AI Studio 上で Google Cloud の請求アカウントを新規作成または連携するときにクレジットを前払い購入し、その残高から Gemini API の利用料を相殺できる。米国の新規請求アカウントから利用可能で、数週間かけてグローバル展開される見込みである。

hrdtbs
hrdtbs 4月15日
2 min read
Visual Studio Code 1.116
AI
VS Code
Read Article

Visual Studio Code 1.116

エージェントの実行ログを後から確認できるデバッグビューが追加された。Copilot CLI の推論負荷調整や、エージェントから既存ターミナルを扱う機能も強化された。

hrdtbs
hrdtbs 4月15日
3 min read
page-agent
AI
Page Agent
Read Article

page-agent

page-agent は自然言語で Web UI を操作する in-page GUI agent。MCP サーバーも提供し、外部エージェントからブラウザ操作を組み込みやすい。

hrdtbs
hrdtbs 4月14日
1 min read
Claude Platform、Messages API に Advisor ツールを追加
AI
Claude
Read Article

Claude Platform、Messages API に Advisor ツールを追加

Executor に Sonnet または Haiku、判断が難しい局面では Opus を Advisor として挟み込むパターンを、サーバー側ツール advisor_20260301 で単一の Messages リクエストにまとめられる。beta ヘッダーとツール宣言で有効化し、利用回数は max_uses で上限設定可能。

hrdtbs
hrdtbs 4月9日
3 min read
Foundry Local 1.0.0
AI
Foundry Local
Read Article

Foundry Local 1.0.0

Microsoft がオンデバイス推論向けのランタイムと SDK 群を一般提供とした。OpenAI 互換 API とモデル管理を同梱し、Windows/macOS/Linux でローカル実行を前提にした配布を狙う。

hrdtbs
hrdtbs 4月9日
1 min read
Chrome DevTools 147
AI
Chrome DevTools
Read Article

Chrome DevTools 147

AI assistance の自動コンテキスト選択とコード生成が強化され、Device Mode や Network パネルなどに複数の改善が入った。DevTools MCP サーバーと CLI も v0.21.0 に更新され、マルチエージェント運用や Lighthouse 監査が拡充された。

hrdtbs
hrdtbs 4月7日
2 min read
GLM-5.1
AI
GLM
Read Article

GLM-5.1

Z.AIは長時間の自律的な実行を想定したフラッグシップモデルGLM-5.1を公開した。モデルウェイトはMIT Licenseで公開され、APIでも提供される。

hrdtbs
hrdtbs 4月7日
1 min read
LLM-jp-4
AI
LLM-jp
Read Article

LLM-jp-4

NII の LLM-jp が 8B(Llama 2 系)と 32B-A3B MoE(Qwen3 MoE 系)をオープンソースで公開。約 12 兆トークン規模コーパス、最大約 6 万 5 千トークン入出力。ABCI 3.0。2026 年度に更大規模を順次公開予定。

hrdtbs
hrdtbs 4月3日
3 min read
VS Code 1.114
AI
VS Code
Read Article

VS Code 1.114

チャット体験の改善を中心に、添付プレビューの動画対応や最終回答のみのコピー機能などが追加された。

hrdtbs
hrdtbs 4月1日
2 min read
Irodori-TTS 500M v2とVoiceDesign公開、絵文字制御とキャプション条件付き日本語TTS
AI
Irodori-TTS
Read Article

Irodori-TTS 500M v2とVoiceDesign公開、絵文字制御とキャプション条件付き日本語TTS

Rectified Flow Diffusion Transformer と DACVAE 連続潜在による日本語 TTS。入力テキストへの絵文字でスタイル・感情・効果音を誘導、短い参照音声からのゼロショット Voice Cloning。v2 は Semantic-DACVAE-Japanese-32dim・学習ステップ約 2.5 倍・前処理とデータフィルタの改善。VoiceDesign はスタイル用キャプション条件付きの別チェックポイント。CLI・Gradio・Hugging Face Hub 推論、コードと公開重みは MIT。日本語入力のみ、漢字読みは同規模他 TTS 比で弱めになる場合あり。

hrdtbs
hrdtbs 3月31日
3 min read
Gemini 3.1 Flash Live公開、Live APIプレビューとSearch Live 200超地域対応
AI
Gemini
Read Article

Gemini 3.1 Flash Live公開、Live APIプレビューとSearch Live 200超地域対応

ネイティブ音声のリアルタイム対話モデル。Google AI StudioのGemini Live APIプレビュー、Gemini Enterprise for Customer Experience、Search Live・Gemini Live利用。ComplexFuncBench Audio 90.8%、Audio MultiChallenge 36.1%(thinking on)。Gemini Liveは応答高速化と文脈追従の約2倍。Search Liveは200超の国・地域で多言語。出力音声はSynthID透かし。

hrdtbs
hrdtbs 3月26日
2 min read
Lyria 3 Pro:Vertex AI・Gemini API・Vidsなど複数製品で最大3分トラック生成に対応
AI
Lyria
Read Article

Lyria 3 Pro:Vertex AI・Gemini API・Vidsなど複数製品で最大3分トラック生成に対応

最長約3分の楽曲とintro・verse・chorus・bridge等の構成指定を特徴とする上位版。Vertex AI(public preview)、Google AI Studio・Gemini API、Google Vids、Geminiアプリ(有料枠から)、ProducerAIでの提供。Workspace顧客・AI Pro/Ultra加入者など面ごとのロールアウト差。出力へのSynthID埋め込み、アーティスト模倣回避、既存コンテンツ照合フィルタ、利用規約・Gen AI禁止利用ポリシー順守。

hrdtbs
hrdtbs 3月25日
2 min read
Claude Cowork と Claude Code、画面操作と Dispatch
AI
Anthropic
Read Article

Claude Cowork と Claude Code、画面操作と Dispatch

Claude Pro と Max 向けのリサーチプレビューとして、コネクタが無い場合はブラウザやマウス・キーボードで画面を操作してタスクを進められる。Dispatch と組み合わせるとスマホから指示し、離席中にデスクトップ側で作業を続けられる。

hrdtbs
hrdtbs 3月23日
3 min read
GitHub Projects、hierarchy view一般提供
AI
GitHub
Read Article

GitHub Projects、hierarchy view一般提供

新規の Project ビューでhierarchy viewをデフォルト有効、既存ビューはShow hierarchyで切替。sub-issue向けフィルタの発見性と自動適用、アクセシビリティ改善。課題テンプレからCopilot自動割当、メンテナ向けBlank issueの扱い変更など。

hrdtbs
hrdtbs 3月19日
1 min read
Google Personal Intelligenceが米国で提供開始
AI
Gemini
Read Article

Google Personal Intelligenceが米国で提供開始

米国で AI Mode in Search / Gemini app / Gemini in Chrome に対して Personal Intelligence が提供開始。GmailやGoogle Photos等をセキュアに接続して、買い物・トラブル解決・旅程提案をパーソナライズ。接続アプリのオン/オフとプライバシー配慮、対象が個人向けで Workspace は対象外。

hrdtbs
hrdtbs 3月17日
3 min read
TensorFlow 2.21リリース
AI
TensorFlow
Read Article

TensorFlow 2.21リリース

LiteRTのメジャーアップデート、低精度データ型のサポート拡充、および各種コンポーネントにおける依存関係更新とバグフィックス体制の強化など。

hrdtbs
hrdtbs 3月6日
2 min read
Claude Opus 4.6リリース
AI
Claude
Read Article

Claude Opus 4.6リリース

コーディング能力の向上、1Mトークンコンテキスト対応(ベータ)、Claude CodeでのAgent Teams機能、APIでのContext compactionやAdaptive thinkingの追加など。

hrdtbs
hrdtbs 2月18日
1 min read
GPT-5.3-Codex公開
AI
OpenAI
Read Article

GPT-5.3-Codex公開

SWE-Bench Proで56.8%を記録した最新のコーディングエージェントモデル。25%の高速化とサイバーセキュリティ能力の向上など。

hrdtbs
hrdtbs 2月5日
1 min read
Grok 4.1 Fast
AI
xAI
Read Article

Grok 4.1 Fast

xAI が API 向けに Grok 4.1 Fast と Agent Tools API を公開した。前者は最大 200 万トークンのコンテキストでツール連携向けに最適化されている。

hrdtbs
hrdtbs 2025年11月19日
2 min read

著者について

Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.

In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.

In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.

In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.

I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.