Grok 4.1 Fast
xAI は API 利用者向けに Grok 4.1 Fast と Agent Tools API を公開した。Grok 4.1 Fast は最大 200 万トークンのコンテキストを扱い、複数ターンにわたるツール呼び出し向けに最適化されている。Agent Tools API は Web 検索、X 検索、リモートコード実行、コレクション検索、MCP 接続をサーバ側でまとめて提供し、クライアント側のキー管理や実行環境の負担を減らす。
モデル ID は grok-4-1-fast-reasoning と grok-4-1-fast-non-reasoning の二種類である。
性能
| モデル | Intelligence Index | 出力速度 (tok/s) | 初回トークンまで (s) | 公称コンテキスト |
|---|---|---|---|---|
| Grok 4.1 Fast (Non-reasoning) | 24 | 131.4 | 0.57 | 200 万トークン |
| Gemini 2.5 Flash (Non-reasoning) | 21 | 191.6 | 0.59 | 100 万トークン |
| GPT-4o (Nov ‘24) | 17 | 102.5 | 0.98 | 約 13 万トークン |
Intelligence Index では Flash や GPT-4o を上回り、出力速度は Flash より遅く GPT-4o より速い。
API 価格の比較
Grok 4.1 Fast では、成功したツール呼び出し 1000 回あたり 5 US ドルが xAI により別途課金される。
| モデル | 入力 ($/1M) | 出力 ($/1M) |
|---|---|---|
| Grok 4.1 Fast | 0.20 | 0.50 |
| Gemini 2.5 Flash (Non-reasoning) | 0.30 | 2.50 |
| GPT-4o (Nov ‘24) | 2.50 | 10.00 |
トークン単価は Flash より低いが、ツール呼び出しが多いと別課金が実コストを左右する。
参考文献
- Grok 4.1 Fast and Agent Tools API | xAI
- Grok 4.1 Fast (Non-reasoning) | Artificial Analysis
- Gemini 2.5 Flash (Non-reasoning) | Artificial Analysis
- GPT-4o (Nov ‘24) | Artificial Analysis
- Intelligence Index methodology | Artificial Analysis
- Models and pricing | OpenAI
- Gemini API pricing | Google AI for Developers