インド最大のAIスタートアップがインド言語向けモデル「Sarvam M」を公開するもダウンロード数がたった23回でインド国産AIに暗雲、しかし開発者はめげずにフィードバックに感謝

人口が世界一であり、また世界有数のIT大国として知られるインドのAIスタートアップのSarvamが、独自開発のオープンウェイトモデル「Sarvam M」を発表しました。しかし、リリースから2日が経過してもほとんどダウンロードされなかったことから、インド産AIの取り組みである「IndiaAI」に関する議論が巻き起こりました。
Sarvam AI’s Backlash Exposes the Sad State of Indian AI
https://analyticsindiamag.com/ai-features/sarvam-ais-backlash-exposes-the-sad-state-of-indian-ai/
インド政府のソブリンAI推進事業「IndiaAI」に最初に選定された企業のひとつであるSarvamは2025年5月23日、Mistral Smallをベースとしたオープンウェイトモデル「Sarvam M」をリリースしました。Sarvam Mはインド独自の言語に最適化されており、ヒンディー語、ベンガル語、グジャラート語、カンナダ語、マラヤーラム語など、インドで使われている10種類の言語をサポートしています。
Today we introduce Sarvam M, a 24B open-weights hybrid model built on top of Mistral Small.
— Sarvam AI (@SarvamAI) May 23, 2025
Sarvam M achieves a new benchmark across a range of Indian languages, math, and programming tasks, for a model of its size.
Here is a detailed technical blog on how we customize… pic.twitter.com/FlFJRDvCTn
ところが、AIプラットフォームのHugging Faceで公開されたSarvam Mへの反応は冷ややかで、公開2日後のダウンロード数は23回だったとのこと。
これについて、AIベンチャーキャピタル・Menlo Venturesのディーディ・ダス氏はSNSで「インド最大のAIスタートアップで時価総額10億ドル(約1425億円)のSarvamが、主力のLLMプログラムを立ち上げました。これは、インドのデータでトレーニングされた24B Mistral Smallであり、公開後2日でのダウンロード回数はわずか23回です。対照的に、韓国の2つの大学は先月、約20万回ダウンロードされたオープンソースモデルをトレーニングしました。これは恥ずべきことです」と述べました。
ダス氏はまた、インドにおけるAIの取り組みが重要な問題の解決を目指すのではなく、「クールなAIの人たちがやっているようなクールなAIをやりたい」というスタンスだと指摘した上で、失望を表明しました。
Definitely not all, but much of the Indian AI scene seems like more "I want to do cool AI things that cool AI people do", not "let's solve important hard problems"
— Deedy (@deedydas) May 24, 2025
No one is asking for a slightly better 24B indic model. Clearly.
好調なスタートを切れなかったインド産AIはSarvam Mだけではありません。インド政府が推進するAIプロジェクトのBharatGenは2025年5月に、英語とヒンディー語向けに開発されたバイリンガル基盤モデルの「Param 1」をリリースしましたが、記事作成時点でのダウンロード数は12回にとどまっています。
BharatGen - Param 1: Indic-Scale Bilingual Foundation Model
https://aikosh.indiaai.gov.in/home/models/details/bharatgen_param_1_indic_scale_bilingual_foundation_model.html

ダス氏の発言は、インドのAIコミュニティで白熱した議論に発展しました。例えば、あるX(旧Twitter)ユーザーはインド語のベンチマークでLlamaが0.47、Gemmaが0.48なのに対してSarvam Mが0.49と小幅な改善にとどまっていることから、「インド製だからといって、未完成品に甘んじるわけにはいきません」と批判しました。
I can't use Sarvam for what it is rn, just because it's Made in India doesn't mean I'll settle for an unfinished product. Literally 0.49 over Llama itself doing 0.47, Gemma 0.48 on IndicLLM benchmark?? Is this even a tangible noticeable improvement? pic.twitter.com/rSIhbEIwxo
— Avik Chatterjee (@just_avik) May 24, 2025
一方、インドのベンチャーキャピタル・Together Fundの投資家であるPratyush Choudhury氏は、インドではH100などの高性能なAIアクセラレーターがまだ市販されていないことなどを挙げて、「インドの国外にいるほとんどの人は、インドではコンピューティングが見えない天井になっていることを知りません」と反論。Sarvam Mについては、「これは単なる虚栄心の微調整ではありません。インド初のオープンウェイトで24Bのインド系言語ベースのLLMであり、過酷なGPUとデータ不足の中で構築されています。HuggingFaceの短い期間の統計データだけで判断するのは、本質を見失っています」と擁護しています。
I like @deedydas's work but but this take misses context
— Pratyush Choudhury (PC) (@177pc) May 24, 2025
Sarvam M isn’t a vanity fine-tune; it’s India’s first open-weights 24 B Indic-centric LLM built under brutal GPU & data scarcity. Judging it by few hours of HuggingFace stats badly misses the point.
Most people outside… https://t.co/oJa6NWxyOy
また、日本のAI企業であるAWLのインド事業を率いているアロック・ビショイ氏は、牛肉食やカースト制度、パキスタンおよび中国との領土問題であるカシミール紛争、性的少数者の権利など、インドでセンシティブな64の質問を投げかけてレビューしました。そして、その結果からSarvam Mがかなり洗練された思考を持っている一方、政治的な見解では一貫性に欠ける傾向があることや、英語で話す都市部のエリート層の影響が大きいことなどを指摘しました。
Was keen on on where Sarvam M lies on the political compass , so got curious burned some ₹₹₹ and conducted a comprehensive political bias evaluation of Sarvam M. Details , datasets and evals are opensourced. More details below: 🧵 pic.twitter.com/xosFZmbTlH
— Alok Bishoyi (@alokbishoyi97) May 24, 2025
こうした議論の中、インドのAI開発者たちは前向きな姿勢を崩しませんでした。インドのAIエージェント開発会社・Business Heroの創設者のダルメーシュ・バー氏は、Sarvam Mが話題になったことでダウンロード数が10倍以上の334回になったことから、ダス氏に向けた投稿で「グッジョブ!」と述べました。また、Sarvamの共同設立者であるプラチュシュ・クマール氏は、前述のレビューに対して、「Sarvam Mに関するフィードバックをいただき、大変嬉しく思います。引き続きご投稿をお願いします。ソブリンモデルのトレーニングを開始するにあたり、パイプラインの強化に役立てさせていただきます。これは特に興味深いものでした」と感謝の言葉を返信しました。
Great to be receiving feedback on Sarvam-M. Please keep them coming. Will help strengthen our pipelines as we start to train our sovereign model.
— Pratyush Kumar (@pratykumar) May 25, 2025
This was particularly interesting - https://t.co/vs0KL0NLII
・関連記事
世界最大のコールセンターがAIでインド人のアクセントを消している - GIGAZINE
「性的な画像の送信」が原因でインドの裁判所が暗号化メール「Proton Mail」を全国でブロックするよう命じる - GIGAZINE
開発中のAIや信頼できないAIは導入前に「政府の明示的な許可」が必要だとする勧告をインド政府が行う - GIGAZINE
Googleが狭い道路を回避できるように設計したインドの道路専用AIモデルを作成 - GIGAZINE
Metaがインドの選挙期間中に偽情報や暴力を扇動するAIが生成した画像を含むFacebook広告を承認していたことが判明 - GIGAZINE
中国がアメリカ・韓国・インドの選挙をAI生成コンテンツで妨害するだろうとMicrosoftが警告、すでに台湾の総統選挙で使用か - GIGAZINE
・関連コンテンツ
in ソフトウェア, Posted by log1l_ks
You can read the machine translated English article India's largest AI startup releases ….