Gemini API File Search、マルチモーダル RAG とページ単位の引用
Gemini API の File Search に、マルチモーダル対応・カスタムメタデータ・ページ単位の引用の 3 点が追加された。非構造化データを整理し、検証可能な RAG を組み立てる開発者向けの更新であり、プロトタイプから大規模利用まで、テキストと視覚データを同一パイプラインで扱える。
- 画像とテキストをネイティブに処理する。Gemini Embedding 2 が視覚データを理解し、キーワードやファイル名に頼らず、自然言語のブリーフで感情的トーンや視覚スタイルに合うアセットをアーカイブ全体から検索できる。
- カスタムメタデータで、
department: Legalやstatus: Finalのようなキーと値のラベルを非構造化データに付与できる。クエリ時にメタデータフィルタを適用し、無関係な文書のノイズを減らして取得の速度と精度を上げる。 - ページ引用では、大規模 PDF から引いた回答について、インデックス済みの各断片にページ番号を紐づける。応答を元ソースの該当ページへ直接示し、ファクトチェックと信頼性の向上を狙う。