Googleが小型の埋め込みモデル「EmbeddingGemma」を発表、メモリ使用量はわずか200MB

Googleがオンデバイスで動作する埋め込みモデル「EmbeddingGemma」を公開しました。EmbeddingGemmaのパラメータ数は約3億で、メモリ使用量はわずか200MBです。
Introducing EmbeddingGemma: The Best-in-Class Open Model for On-Device Embeddings - Google Developers Blog
https://developers.googleblog.com/en/introducing-embeddinggemma/

EmbeddingGemma is our new best-in-class open embedding model designed for on-device AI. 📱
— Google DeepMind (@GoogleDeepMind) September 4, 2025
At just 308M parameters, it delivers state-of-the-art performance while being small and efficient enough to run anywhere - even without an internet connection. pic.twitter.com/QGDmTkOb1I
EmbeddingGemmaは、約1億個のモデルパラメータと約2億個の埋め込みパラメータで構成される埋め込みモデルです。高効率パラメータ設計により、ハードウェア上で直接実行される検索拡張生成やセマンティック検索などの技術を用いたアプリケーションを構築できます。小型、高速、効率的で、カスタマイズ可能な出力次元と2Kトークンコンテキストウィンドウを備えており、携帯電話やノートPC、デスクトップPCなどの日常的に使用するデバイスでオフライン動作することが想定されてます。
EmbeddingGemmaは100以上の言語で学習済みであり、データの精度を落とすことでサイズを小さくする「量子化」の技術を用いることで、200MB未満のRAMで実行できるほど小型なモデルとなっています。テキスト埋め込みモデルの性能を評価するベンチマークである「MTEB」において、「5億パラメータ未満のオープン多言語テキスト埋め込みモデルとして、最高評価を獲得した」とGoogleのスンダー・ピチャイCEOは述べています。
Introducing EmbeddingGemma, our newest open model that can run completely on-device. It's the top model under 500M parameters on the MTEB benchmark and comparable to models nearly 2x its size – enabling state-of-the-art embeddings for search, retrieval + more.
— Sundar Pichai (@sundarpichai) September 4, 2025
以下は、MTEBのスコアを表に示したもの。横軸がモデルのサイズ、縦軸がスコアで、グラフによるとEmbeddingGemmaはサイズがほぼ2倍のモデルに匹敵するパフォーマンスを実現しています。

また、EmbeddingGemmaはRAG(検索拡張生成)パイプラインの構築に特徴があります。RAGパイプラインには、ユーザーの入力に基づいて関連するコンテキストを取得し、そのコンテキストに基づいた回答を生成するという2つの重要な段階があります。EmbeddingGemmaでは、最初の検索ステップの品質を高いパフォーマンスで保証することで、正確で信頼性の高いオンデバイスアプリケーションに必要な高品質な表現を提供します。
EmbeddingGemmaはHugging Face、Kaggle、Vertex AIからダウンロード可能。EmbeddingGemmaをプロジェクトに統合する方法などは、Googleのドキュメントから確認できます。
・関連記事
わずか2GBのメモリ使用量でスマホでの実行もOKな軽量オープンウェイトモデル「Gemma 3n」をGoogleが正式リリース、音声や動画の入力にも対応し日本語ももちろんOK - GIGAZINE
Googleがスマホなどの低スペックデバイスでも実行可能な小型高性能AIモデル「Gemma 3 270M」をリリース、省電力性能に優れ特定分野に特化したAIの基盤モデルとしても使える - GIGAZINE
画像生成AI「Stable Diffusion 3.5 Large」の18GBを超えるVRAM使用量を40%も削減して11GBにする新技術をNVIDIAが公開 - GIGAZINE
Googleのスンダー・ピチャイCEOがAIの将来性や検索エンジンの進化について語るインタビュー、「トランプ大統領に有利になるように検索ランキングやAIモードを変更しない」と明言 - GIGAZINE
Googleが無料の超高品質な画像編集AI「Gemini 2.5 Flash Image」をリリース、日本語で指示できて実写からアニメキャラへの変換も可能 - GIGAZINE
・関連コンテンツ
in ソフトウェア, Posted by log1e_dh
You can read the machine translated English article Google launches compact embedding model ….