入力して検索を開始
ComfyUIでQwen-Image-Editを試した結果をまとめる。 ComfyUIが提供するテンプレートが良く出来ており、Lightingもすぐに導入できるようになっている。オブジェクトの追加・削除・変更などは安定して出来たが、スタイルの変更やテキストの編集には一部難があるように感じた。
Hugging Face Spacedでホスティングしているfairseqを利用したアプリをGradio v5へ更新する際に発生した依存関係エラーと対応メモ。
MCPの仕様、SDKやサーバーの例、MCPのサポート状況、セキュリティ上の懸念、代替の可能性について。
知人のために2025年版 ComfyUIのセットアップを紹介する内容です。細かいところは直接説明するので省いています。
現在はプレビューなため、Agent ModeはVSCode Insidersでのみ利用可能。合わせてCopilot Editsが一般公開、またVisionもプレビューでの利用が可能になった。
Hugging Face固有の内容はほぼない。Windows環境からSSH接続しようとするとError connecting to agentと言われた。その対応をまとめる。
GitHub上のclaude-api skillを各社がバンドルし、IDEやターミナル上でClaude API向けのエージェント設計・プロンプトキャッシュ・モデル移行のガイドをその場で参照できるようになった。
Gemini アプリ上でプロンプトから PDF、Microsoft Word や Excel、Google の各ドキュメント形式などを生成し、端末へのダウンロードや Google Drive への書き出しができるようになった。全世界の利用者向けに提供される。
Copilot CLI の遠隔操作、ワークスペース全体での意味索引と GitHub 横断検索、スキル分離、MCP 宣言とトークン効率の改善が柱である。
Ableton・Adobe Creative Cloud・Affinity・Autodesk Fusion・Blender・Resolume・SketchUp・Spliceなど制作ツール向けのコネクタを追加し、教育機関向け提供も始めた。
OpenAI と AWS が戦略的パートナーシップを拡大し、AWS 環境で OpenAI のモデル API、Codex、Amazon Bedrock Managed Agents(OpenAI 提供)を限定プレビューとして提供する。企業は既存の調達・セキュリティ・課金の枠組みのままフロンティアモデルやエージェント基盤を試せる。
オープンウェイト向けに、有害プロンプトを送らず中間層の活性パターンから安全訓練の残存を測る CLI とライブラリがソースで公開され、続いて PyPI にも載った。Apache 2.0。
GitHub は全 Copilot プランをプレミアムリクエスト単位からトークン消費ベースの GitHub AI Credits に切り替え、2026 年 6 月 1 日に移行すると発表した。座席単価は据え置きで、補完と Next Edit 提案は引き続きクレジット消費の対象外である。
両社は契約を改定し、Microsoft を主要クラウドパートナーとしつつ OpenAI が全製品を任意のクラウドで提供できることを明文化した。Microsoft 向けの OpenAI IP ライセンスは 2032 年まで継続しつつ非独占となり、収益分配の扱いも更新される。
CLI から `/ultrareview` により、リモートのサンドボックス上で多数のレビューエージェントが差分を検証する深層コードレビューが使える。Claude Code 2.1.86 以降のリサーチプレビューで、従来のローカル `/review` とは範囲とコスト構造が異なる。
業務ツールに加え、旅行・買い物・エンタメなど生活圏のアプリを会話から接続できるようにした。会話文脈に応じたコネクタ提案や、複数候補の併記にも対応する。
セッション横断で学習するメモリ層をファイルとしてマウントし、APIや監査ログで運用できる。エンタープライズ向けにスコープ分割や共有ストアにも対応する。
Issue と Project の UI から cloud agent セッションの一覧表示とサイドバー操作が行えるようになった。Project では既定でセッション列が有効化される。
Pull request を与えると、コメント・差分・コミット・レビューを文脈に含めた回答が得られる。構造化されたレビュー案や要約を依頼できる。パブリックプレビュー利用者は diff 上の Copilot からも質問列を辿れる。
OpenAI が GPT-5.5 と GPT-5.5 Pro を ChatGPT および Codex に展開し、API でも近日利用予定とした。併せて同モデルの安全性評価の範囲を System Card として要約する。
Workspace・Google AI の対象プラン向けに、Drive 上の Ask Gemini および Drive projects、会話の継続を含む一連の機能が一般提供に移行し、リリース形態と言語に応じた段階的ロールアウトで提供される。
一般的情報を求める短いやり取り向けに、高信頼度の答えをより速く返す「Fast answers」を展開。過去会話とメモリは参照せず、ウェブとモバイルの全世界利用者向け。Personalization からオフ可能。
米国内で身元確認済みの臨床医向けに、診療現場のエビデンス確認・記録・医学研究などを支援する無料版 ChatGPT を提供開始。既存アカウントから別ワークスペースとして利用できる。
DeepSeek が V4 系 MoE 言語モデル(Flash と Pro)のプレビューを公開し、百万トークン窓と API・オープンウェイト配布をそろえた。ハイブリッド注意とポストトレーニング手順を主な技術軸として説明している。
Google Cloud は Vertex AI の発展系として、エージェントの構築から運用・統治・評価までを束ねる Gemini Enterprise Agent Platform を示した。今後の Vertex AI 機能展開は同プラットフォーム経由が前提となる方針である。
Google Sheets に、列の文脈やプロンプトから空セルをまとめて埋める Fill with Gemini が追加された。ドラッグ操作と範囲選択からの入力の二通りがあり、既存の AI 関数への入口として動作する。
OpenAI が Responses API に WebSocket 接続方式を導入し、エージェント的な多段リクエストの累積遅延を抑えた。既存の `response.create` ボディを維持しつつ、接続スコープで状態を再利用する設計としている。
Copilot Business と Enterprise でチャットに独自 API キー(BYOK)を接続でき、ブロック単位のインクリメンタル描画やエージェントセッションの並び替え、ターミナル上の Copilot CLI 起動不具合の修正を含む。TypeScript 6.0.3 を同梱する。
ChatGPT向けの新しい画像生成モデルが全プランで使えるようになった。有料プランではThinkingまたはProのモデル選択時に、生成前の計画と精緻化を行うimages with thinkingが利用できる。
Gemini 3.1 Pro を基盤にした自律調査エージェントを Deep Research と Deep Research Max の二系統で提供し、MCP・可視化・コラボ計画などを追加したうえで有料ティアの一般利用プレビューが始まった。
Google が Chrome に組み込む Gemini in Chrome を、日本国内の Mac・Windows・Chromebook Plus のデスクトップ利用者向けに順次有効化する。Gemini 3.1 を用い、サイドパネルから要約・複数タブの整理・Google 各サービス連携や Nano Banana 2 による画像変換に対応する。
Copilot Pro・Pro+・Student の新規申込を一時停止し、個人プランの利用上限を引き締める。Pro から Opus 系モデルを外し、Pro+ は Opus 4.7 のみ残して 4.5・4.6 を廃止。VS Code と Copilot CLI で上限に近づいた利用状況を表示する。
Google AI Pro および Ultra の加入者が Google AI Studio で利用上限の引き上げを受け、Nano Banana Pro と Gemini Pro 系モデルにもアクセスできるようになった。
エージェントが既存のデザインシステム上で UI 意図をストリーミング記述するためのフレームワーク非依存フォーマットが 0.9 に更新され、Web 向け共有コア、公式 React レンダラ、Python 向け Agent SDK、トランスポート周りの整理が入った。
Anthropic Labs が Claude Design を研究プレビューで公開した。Claude Opus 4.7 を基盤にし、プロトタイプやスライドなどの視覚成果物を会話と細かな編集で仕上げ、Claude Code への引き渡しも用意している。
すべての Copilot プランで GitHub Copilot CLI から Copilot auto model selection を使えるようになった。利用者のプランと管理者ポリシーに応じてモデルを動的に切り替え、プレミアムリクエストは選択されたモデルの倍率に基づいて消費される。
xAI が Grok Voice などと同一スタックの Speech to Text と Text to Speech を REST と WebSocket のスタンドアロン API として公開した。バッチとストリーミングの従量課金を案内している。
Anthropic が Claude Opus 4.7 を一般提供し、API では claude-opus-4-7 が利用可能になった。高度なソフトウェア工学や視覚タスクの改善に加え、サイバー悪用を検知して遮断するガードや正当なセキュリティ用途向けの検証プログラムが案内されている。
Google が macOS 向けの Gemini デスクトップアプリを提供する。グローバルショートカットやウィンドウ共有による文脈付きの支援を、ブラウザを開かずに呼び出せる。
GitHub CLI に discover・install・update・publish をまとめた gh skill が追加され、リポジトリ由来のエージェントスキルを各ホスト向けディレクトリへ一括導入できる。GitHub CLI v2.90.0 以上が必要で、公開はパブリックプレビューである。
Enterprise または Organization 管理者が自前の MCP レジストリ URL を Copilot 方針に登録し、登録外の MCP サーバー利用をターミナル上の Copilot CLI でも防げる。パブリックプレビューで Business と Enterprise 向けである。
ChatGPT にサインインした Codex デスクトップアプリ利用者向けに、Mac 上のバックグラウンド操作、アプリ内ブラウザー、gpt-image-1.5 による画像生成、プラグイン拡充、SSH 接続やメモリのプレビューなどを順次提供する。
Google AI Studio 上で Google Cloud の請求アカウントを新規作成または連携するときにクレジットを前払い購入し、その残高から Gemini API の利用料を相殺できる。米国の新規請求アカウントから利用可能で、数週間かけてグローバル展開される見込みである。
Python 向け Agents SDK に、ファイルとツールを横断するモデルネイティブなハーネスと、制御された環境で実行するサンドボックス統合が追加された。API 経由で全顧客に提供され、トークンとツール利用に基づく通常の API 課金が適用される。
エージェントの実行ログを後から確認できるデバッグビューが追加された。Copilot CLI の推論負荷調整や、エージェントから既存ターミナルを扱う機能も強化された。
Gemini in Chrome で、よく使うプロンプトを Skill として保存し、複数タブを対象に一括実行できる機能がロールアウトされた。
プロンプト・リポジトリ・コネクタを束ねた自動化を、スケジュール・API・GitHubイベントから起動できる。Web上のClaude Code基盤で動き、端末常時接続を要しない。
page-agent は自然言語で Web UI を操作する in-page GUI agent。MCP サーバーも提供し、外部エージェントからブラウザ操作を組み込みやすい。
月額100ドルの Pro を新設し、200ドル Pro と Plus の Codex 利用の扱いを更新する。100ドル Pro では GPT-5.4 の無制限利用、GPT-5.4 Pro へのアクセス、期間限定で Plus 比最大10倍までの Codex 利用枠(従来の Plus 比 5 倍から拡大)が含まれる。
Coworkを全有料プランで一般提供しつつ、Enterprise向けRBAC・グループ予算・利用分析・OpenTelemetry・MCPコネクタの操作単位制限など、組織展開向けの管理機能を追加した。
Executor に Sonnet または Haiku、判断が難しい局面では Opus を Advisor として挟み込むパターンを、サーバー側ツール advisor_20260301 で単一の Messages リクエストにまとめられる。beta ヘッダーとツール宣言で有効化し、利用回数は max_uses で上限設定可能。
Microsoft がオンデバイス推論向けのランタイムと SDK 群を一般提供とした。OpenAI 互換 API とモデル管理を同梱し、Windows/macOS/Linux でローカル実行を前提にした配布を狙う。
組み合わせ可能なAPIとマネージド実行環境を束ね、サンドボックスや長寿命セッションなど運用面を肩代わりする。公開ベータとして提供が始まり、トークン従量にアクティブランタイムのセッション時間課金が上乗せされる。
Gemini アプリに Notebooks 機能が追加された。NotebookLM と同期し、チャットと資料をプロジェクト単位で扱える。
Google Colab の Gemini 統合に、ノートブック単位で振る舞いを調整できる Custom Instructions と、段階的な学習支援を行う Learn Mode が追加された。共有ノートブックでは、作成者が設定した指示が共同編集者にも適用される。
Microsoft が SQL MCP Server を紹介した。Data API builder を基盤に、AI エージェントが SQL データへアクセスするための MCP サーバーをコンテナとして自己ホストできる。
AI assistance の自動コンテキスト選択とコード生成が強化され、Device Mode や Network パネルなどに複数の改善が入った。DevTools MCP サーバーと CLI も v0.21.0 に更新され、マルチエージェント運用や Lighthouse 監査が拡充された。
GitHub Copilot CLI が、GitHub 側のモデルルーティングを使わずに外部プロバイダやローカルモデルへ接続できるようになった。オフラインモードや、BYOK 利用時の GitHub 認証不要などの挙動も整理された。
Z.AIは長時間の自律的な実行を想定したフラッグシップモデルGLM-5.1を公開した。モデルウェイトはMIT Licenseで公開され、APIでも提供される。
NII の LLM-jp が 8B(Llama 2 系)と 32B-A3B MoE(Qwen3 MoE 系)をオープンソースで公開。約 12 兆トークン規模コーパス、最大約 6 万 5 千トークン入出力。ABCI 3.0。2026 年度に更大規模を順次公開予定。
Codex専用シートの従量課金化とトークン課金、レート制限なし、従来シートはCodex利用上限付きのまま、ChatGPT Businessの年額単価25ドルから20ドルへ、新規Codex専用メンバー向けクレジットプロモ、ビジネス利用とCodexの利用規模に関する数値。
GitHub Copilot のエージェント実行基盤をアプリやワークフローに組み込むための SDK が Public Preview で利用可能になった。Node.js/TypeScript、Python、Go、.NET、Java 向けに提供される。
Flex と Priority の inference tier が追加され、同期 API の `service_tier` 指定でコストと信頼性を用途別に選べる。Flex は Standard 比で割引、Priority は Standard より高いレート帯とされる。
チャット体験の改善を中心に、添付プレビューの動画対応や最終回答のみのコピー機能などが追加された。
Rectified Flow Diffusion Transformer と DACVAE 連続潜在による日本語 TTS。入力テキストへの絵文字でスタイル・感情・効果音を誘導、短い参照音声からのゼロショット Voice Cloning。v2 は Semantic-DACVAE-Japanese-32dim・学習ステップ約 2.5 倍・前処理とデータフィルタの改善。VoiceDesign はスタイル用キャプション条件付きの別チェックポイント。CLI・Gradio・Hugging Face Hub 推論、コードと公開重みは MIT。日本語入力のみ、漢字読みは同規模他 TTS 比で弱めになる場合あり。
Veo 3.1 Fast より50%未満のコストで同等速度、Text-to-Video と Image-to-Video、16:9・9:16・720p・1080p、4・6・8秒の尺、4月7日から Veo 3.1 Fast の価格引き下げ予定。
Claude Code上からローカルCodex CLIとCodex appサーバー経由でCodexを呼び出し。標準レビュー、対立型レビュー、別エージェントによる二段目への引き渡し。ChatGPT(Free含む)またはOpenAI APIキー、Node.js 18.18以上が必要。
ネイティブ音声のリアルタイム対話モデル。Google AI StudioのGemini Live APIプレビュー、Gemini Enterprise for Customer Experience、Search Live・Gemini Live利用。ComplexFuncBench Audio 90.8%、Audio MultiChallenge 36.1%(thinking on)。Gemini Liveは応答高速化と文脈追従の約2倍。Search Liveは200超の国・地域で多言語。出力音声はSynthID透かし。
承認プロンプトの自動化。入力は prompt-injection probe、実行前は Sonnet 4.6 の transcript classifier(2段階)。プロジェクト内編集は分類器を経由せず、シェル・外部ツール等のみゲート。評価では実オーバーエージャー52件でパイプライン全体の偽陰性率17%。
Copilot Free/Pro/Pro+の入力・出力・コード断片と文脈が、オプトアウトしない限りモデル訓練・改善に用いられる。Business/Enterpriseは対象外。Privacy設定で拒否可能、関連会社(Microsoft含む)との共有あり。
最長約3分の楽曲とintro・verse・chorus・bridge等の構成指定を特徴とする上位版。Vertex AI(public preview)、Google AI Studio・Gemini API、Google Vids、Geminiアプリ(有料枠から)、ProducerAIでの提供。Workspace顧客・AI Pro/Ultra加入者など面ごとのロールアウト差。出力へのSynthID埋め込み、アーティスト模倣回避、既存コンテンツ照合フィルタ、利用規約・Gen AI禁止利用ポリシー順守。
Customizations エディタ、CLI/Claude への MCP、ネスト subagent、ピッカーでの Thinking Effort、テーマとブラウザ周り。
Storage Bucket・モデル・データセットをローカル fs としてマウント。Bucket は読み書き、モデル・データセットは読み取り専用。エージェント向けストレージとしての位置づけ。
Claude Pro と Max 向けのリサーチプレビューとして、コネクタが無い場合はブラウザやマウス・キーボードで画面を操作してタスクを進められる。Dispatch と組み合わせるとスマホから指示し、離席中にデスクトップ側で作業を続けられる。
Cloudflare AI Search に OpenAI 互換形式の REST API エンドポイントが追加された。既存の OpenAI SDK から `messages` 配列を使う構成で検索とチャットを呼び出せる。
Cloudflare AI Search に、API 認証なしで利用できる公開エンドポイントと、サイトに埋め込める検索・チャットUIスニペットが追加された。あわせて MCP エンドポイントも提供され、エージェントからコンテンツ検索に接続できる。
新規の Project ビューでhierarchy viewをデフォルト有効、既存ビューはShow hierarchyで切替。sub-issue向けフィルタの発見性と自動適用、アクセシビリティ改善。課題テンプレからCopilot自動割当、メンテナ向けBlank issueの扱い変更など。
テスト・linterに加えCodeQLやsecret scanning等の実行をリポジトリ設定から個別に選択可能に。無料・デフォルト有効、GitHub Advanced Securityライセンス不要の旨を継続。
`editor-browser` デバッグ、Copilot CLI の steering と権限、stdio MCP の sandbox、親リポのカスタマイズ探索。
MCP 経由でコミット前・PR 前の変更を GitHub secret scanning で検査。Secret Protection 有効リポジトリ向け。Copilot CLI と VS Code の有効化手順。
米国で AI Mode in Search / Gemini app / Gemini in Chrome に対して Personal Intelligence が提供開始。GmailやGoogle Photos等をセキュアに接続して、買い物・トラブル解決・旅程提案をパーソナライズ。接続アプリのオン/オフとプライバシー配慮、対象が個人向けで Workspace は対象外。
GitHub Pages上の検索付きサイト、概念解説のLearning Hub、VS CodeとGitHub Copilot CLI向けデフォルトplugin marketplace、PR経由の更新フローなど。
1M context を標準単価のまま全長で利用可能、長文脈プレミアムなし。メディア上限は画像・PDF で 600、200K 超は beta ヘッダー不要。Claude Code は Max・Team・Enterprise の Opus 4.6 で 1M を標準搭載。Bedrock・Vertex AI・Microsoft Foundry でも利用可能。
GitHub Actionsワークフロー実行における手動承認をスキップし、即座に開始できるリポジトリ設定が追加。
Imagine with Claude のプレビュー由来の方向性をチャットに統合、チャート・図・その他の視覚化を応答本文へインライン表示。artifacts とは別の一時的補助、デフォルト有効、全プランタイプ対応。
Ask Mapsの会話型検索と、Immersive Navigationの3D表示・自然な音声案内・代替ルート比較・到着前後の支援を含むGoogle Maps更新。
開いている Excel・PowerPoint 全体の文脈を 1 会話で共有。アドインで Skills・instructions 利用。Financial Analysis プラグイン経由のスターター。Bedrock・Vertex AI・Foundry と LLM gateway。Excel Agent Mode(Copilot)連携。
ワークフローをアプリ化するApp ModeとApp Builderの追加、共有プラットフォームComfyHubプレビューの公開など。
テキスト・画像・動画・音声・PDFを単一のembedding空間に写し、100超言語のsemantic intentを扱う。MRLで3072・1536・768次元を推奨。
Docsの下書き生成とスタイル統一、SheetsのFill with Gemini、Slidesの編集可能スライド生成、DriveのAI Overview対応。
PRオープン時にエージェント群が並列レビュー、概要コメントとインライン指摘。Team/Enterpriseのベータ。トークン課金でレビューあたりおおむね15〜25ドル、GitHub Appと設定で利用。
AnthropicのClaude Coworkを採用した「Copilot Cowork」を導入。複数ステップの複雑なタスクを自律実行。
週次 Stable 初版。セッション権限、Autopilot プレビュー、エージェント単位 hooks、デバッグスナップショット。
AIを活用した脆弱性報告プロセスの確立に向けた提携。メンテナの負担を軽減し、迅速な修正を実現する新たなセキュリティ調査のモデルを提示。
Figma MCP serverを利用して、GitHub CopilotからFigmaにレンダリング済みのUIを編集可能なフレームとして送信可能になった。VS Code向けに提供開始。
LiteRTのメジャーアップデート、低精度データ型のサポート拡充、および各種コンポーネントにおける依存関係更新とバグフィックス体制の強化など。
agentic tool calling によるリポジトリ文脈の動的取得、Copilot Pro 系プランでの一般提供
最大100万トークンのコンテキスト対応、ネイティブのコンピュータ操作搭載など。
Codexを含むChatGPTプラン向けに、Windowsデスクトップアプリの提供を開始。複数エージェントの並行実行などに連携。
Agent plugins、agentic browser tools、セッション維持とデバッグ可視化、js/ts.* 設定統一など。
evalの執筆支援、benchmarkモード、マルチエージェント並列評価、comparatorによるA/B比較、トリガー用descriptionの調整支援、ローカル保管・ダッシュボード・CI連携など。
OSSメンテナー向けにClaude Maxを6か月間無償提供するClaude for Open Sourceプログラム。GitHubスター数やnpmダウンロード数に基づく応募条件と、1万件までの応募上限や申込期限など。
PR内で検出された問題を自動で修正・テストし、プレビュー付きで提案を投稿する機能の公開。
Gemini Flashの高速処理とプロフェッショナルな画像生成能力を統合。対象物の一貫性保持、4K解像度対応、文字描画など。
Claudeのコンピューター操作能力(computer use)向上が目的。Verceptチームが合流し、既存製品は数週間以内に提供を終了予定。
タスクのスケジュール実行、テンプレート化、専用ページでのタスク管理機能の追加など。
公開用Google APIキーがGemini API有効化時に暗黙的に認証情報として機能する脆弱性。約2,863件の公開キーで確認。
ローカルで動作する Claude Code セッションをスマホ・タブレット・他ブラウザから継続可能。Max プランでリサーチプレビュー提供。
金融向けプラグイン5種の公開、FactSet・MSCIのMCPコネクタ、LSEG・S&P Globalのパートナープラグイン、Claude in ExcelとClaude in PowerPointのクロスアプリ連携のリサーチプレビューなど。
手動でThinkingを選択した際の合計context windowを、従来の196kトークンから256kトークン(入力128k、最大出力128k)に変更。
デスクトップアプリ内でのライブプレビュー、コード差分の自動レビュー、PR監視とマージ機能、セッション継続機能の追加など。
コードベースのセキュリティ脆弱性をスキャンし、ソフトウェアパッチを提案する機能の追加。現在限定プレビューとして提供中。
これまでMax・Team・Enterpriseプラン限定だった拡張機能がProプランでも利用可能に。コネクタ機能もサポート。
複雑な問題解決に向けた推論能力の向上、各種プロダクトへの機能展開など。
コーディング能力の向上、1Mトークンコンテキスト対応(ベータ)、Claude CodeでのAgent Teams機能、APIでのContext compactionやAdaptive thinkingの追加など。
コーディングやコンピュータ操作能力が大幅に向上。Opus 4.5を凌ぐ性能と1Mコンテキストウィンドウを持つ。
テキストや画像から30秒の楽曲を生成できるGoogle DeepMindの最新音楽生成モデル。SynthIDによる電子透かしも埋め込み。
RaycastのGitHub Copilot extensionを利用したIssueの直接アサイン、タスクの新規作成、進捗確認に対応。
LLM・AIエージェント向けのSlack連携サーバー提供、セキュアな検索APIの追加、検索スコープの細分化など。
OpenClaw作者のPeter Steinberger氏がOpenAIに参加。プロジェクトは財団へ移行し、今後もオープンソースとして継続。
ChatGPTでのGPT-4oおよびGPT-5等各種モデルの提供終了に関する案内。APIについての変更はなし。
科学・研究・工学向けの推論モード「Deep Think」のメジャーアップデート。ARC-AGI-2で84.6%を達成するなど、推論能力が大幅に向上。
リアルタイムコーディングに特化した小型モデル。1000トークン/秒の生成速度、Cerebrasとの提携によるインフラ活用など。
Issue Triage Workflowに関するプロンプトインジェクション脆弱性。GitHub Actionsのキャッシュポイズニングを利用した権限昇格のリスクが指摘された。
Google Cloud上でData Commons MCPサーバーのホスティングが開始。ローカルへのインストール不要で、AIエージェントからData Commonsのデータを利用可能になった。
WebGPUランタイムの導入による大幅なパフォーマンス向上、Node.js/Bun/Denoでの実行サポート、新しいビルドシステムによる軽量化など。
SWE-Bench Proで56.8%を記録した最新のコーディングエージェントモデル。25%の高速化とサイバーセキュリティ能力の向上など。
ComfyUIでの利用に最適化された2Bパラメータのアニメ特化モデル。$1Mの「Open AI」助成金プログラムによる最初の成果物として公開。
Google公式の技術ドキュメントをMarkdown形式で検索および取得できるAPIと公式MCP Serverのパブリックプレビュー版が公開。
MCP AppsやAgent hook、SkillのSlash command呼び出しのサポート、統合ブラウザの追加など
エンタープライズ向けのセキュリティ機能、Gitワークフローの統合、SnowflakeやAWSとのデータ連携機能などを追加して正式公開。
Qwen3-Next-80B-A3B-Baseをベースにしたコーディングエージェント向けモデル。SWE-Bench Verifiedで70.6%を達成。
macOS向けデスクトップアプリ「Codex App」を発表。複数のコーディングエージェントを管理し、並行開発を可能にする。
GitHub Copilotからメールや会議録などのMicrosoft 365データへアクセス可能にするMCPサーバーのパブリックプレビューを開始。
2026年2月13日にGPT-4o、GPT-4.1、o4-miniなどをChatGPTから削除。APIには変更なし。
月額1,200円でGemini 3 ProやNano Banana Pro、200GBストレージなどが利用可能な新プラン。
画像の静的な理解からエージェント的な処理への転換。ズームや検査、画像注釈、視覚的な数学やプロットなどが可能に。
MCPツールがリッチなインタラクティブUIをチャット内でレンダリング可能に。
Coding Agentでの利用に最適化されたPlaywrightのCLIモード。トークン効率が高く、ブラウザ操作のSkillを提供。
Google AI Pro/Ultraユーザー向けに提供。Gemini 3モデルを用い、Gmailや写真からパーソナライズされた検索結果を提案。
IDE内で動作するAgent駆動のデザインツール「Pencil」公開。AI Agentがプロダクションコード(React/HTML/CSS)を直接生成。
Alibaba CloudのQwen3-TTSファミリーがオープンソース化。音声クローン、音声デザインなどを提供し、10言語に対応。
AIエージェントにおけるBashとファイルシステムの最適性を検証。構造化データにはSQL、探索にはBashが適していると結論。
実装前に設計を議論できるPlan mode、推論モデルGPT-5.2-Codexの追加など。
VercelがAIエージェント向けのスキルパッケージマネージャ `skills` およびディレクトリサイト `skills.sh` を公開した。コマンドを実行するだけでエージェントにフレームワークのベストプラクティス等のスキルを追加できる。
複数プロバイダ(OpenAI、Anthropic等)のLLMを統一インフェースで利用できるMozilla製Go言語向けライブラリ。ストリーミング処理やエラーハンドリングの正規化に対応。
Markdownファイルでコンテキストを管理するcontext-driven developmentを提案し、AIエージェントによる開発を制御可能にする。
OpenAI が、開発者が ChatGPT にアプリを提出し、審査および公開申請を行えるようになったことを発表した。
GPT Image 1.5のリリースにより生成コストが削減。数十種類のプリセットスタイルなどが利用可能に。
Google翻訳にGeminiを活用した新しい翻訳モデルが追加され、リアルタイム音声翻訳のベータ版も導入された。
xAI が API 向けに Grok 4.1 Fast と Agent Tools API を公開した。前者は最大 200 万トークンのコンテキストでツール連携向けに最適化されている。
Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.
In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.
In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.
In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.
I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.