307文字
2分
編集

Grok 4.1 Fast

xAI は API 利用者向けに Grok 4.1 Fast と Agent Tools API を公開した。Grok 4.1 Fast は最大 200 万トークンのコンテキストを扱い、複数ターンにわたるツール呼び出し向けに最適化されている。Agent Tools API は Web 検索、X 検索、リモートコード実行、コレクション検索、MCP 接続をサーバ側でまとめて提供し、クライアント側のキー管理や実行環境の負担を減らす。

モデル ID は grok-4-1-fast-reasoninggrok-4-1-fast-non-reasoning の二種類である。

#性能

モデルIntelligence Index出力速度 (tok/s)初回トークンまで (s)公称コンテキスト
Grok 4.1 Fast (Non-reasoning)24131.40.57200 万トークン
Gemini 2.5 Flash (Non-reasoning)21191.60.59100 万トークン
GPT-4o (Nov ‘24)17102.50.98約 13 万トークン

Intelligence Index では Flash や GPT-4o を上回り、出力速度は Flash より遅く GPT-4o より速い。

#API 価格の比較

Grok 4.1 Fast では、成功したツール呼び出し 1000 回あたり 5 US ドルが xAI により別途課金される。

モデル入力 ($/1M)出力 ($/1M)
Grok 4.1 Fast0.200.50
Gemini 2.5 Flash (Non-reasoning)0.302.50
GPT-4o (Nov ‘24)2.5010.00

トークン単価は Flash より低いが、ツール呼び出しが多いと別課金が実コストを左右する。

#参考文献