GoogleがEmbeddingGemmaを公開、200MB未満のRAMで動作可能

GoogleがEmbeddingGemmaを公開した。308Mパラメータのコンパクトなオープン埋め込みモデルで、500M未満のモデル中最高性能を達成し、オンデバイスAIを実現する。

EmbeddingGemmaの特徴：

Gemma 3nとの連携により、モバイルファーストのRAGパイプラインやセマンティック検索をオフラインで実現。sentence-transformers、llama.cpp、MLX、Ollama、LiteRT、transformers.jsなど主要ツールとの統合も完了しており、すぐに利用開始可能。

主なユースケース：