マサチューセッツ工科大学が「研究者がAIツールの支援でより多くの発見をした」と主張する論文を撤回

by Scott Beale
マサチューセッツ工科大学(MIT)が、同大学院生が発表した論文を撤回すると発表しました。この論文は未査読論文リポジトリのarXivに掲載されたもので、「AIツールの支援を受けた研究者は、支援を受けていない研究者よりも生産性が著しく高い」と主張する内容でした。
Assuring an accurate research record | MIT Economics
https://economics.mit.edu/news/assuring-accurate-research-record

MIT disavows doctoral student paper on AI's productivity benefits | TechCrunch
https://techcrunch.com/2025/05/17/mit-disavows-doctoral-students-paper-on-ai-productivity-benefits/
MIT Says It No Longer Stands Behind Student’s AI Research Paper - WSJ
https://www.wsj.com/tech/ai/mit-says-it-no-longer-stands-behind-students-ai-research-paper-11434092
発表された論文「Artificial Intelligence, Scientific Discovery, and Product Innovation」はAI技術が科学的発見と製品革新に与える影響を実証的に調査したもので、1018人の研究者にAIベースの材料発見ツールを無作為に導入し、その効果を検証しています。

この論文によると、AIの支援を受けた研究者は受けていない研究者と比較して44%も多くの新材料を発見し、それにより特許出願は39%、製品プロトタイプ開発は17%増加したとのこと。また、AIが研究者の「アイデア生成業務」の57%を自動化した結果、研究者はAIが提示する候補物質の評価に時間を費やすようになったそうです。
ただし、この効果には格差があり、生産性が高い上位の研究者ほどAIの恩恵を受けやすく、下位の研究者は偽陽性の候補に労力を浪費する傾向があったことがわかりました。アンケート調査によると、AIツールを使用した研究者の82%が創造性の低下やスキルの未活用により仕事への満足度が下がったと回答。生産性の向上による満足感は一部あるものの、多くの研究者が総合的に職務満足度の低下を経験しています。
そして、MITは2025年5月16日に発表した声明で、この論文に深刻な懸念が発生したため、内部で非公開の調査を実施した結果、この論文を公開の場から撤回すべきだと結論づけたと述べています。

by Niklas Tenhaef
MITは、論文の出典、データの信頼性および妥当性、そして研究内容の真実性について「信頼できない」とし、arXivおよび投稿先の学術誌「The Quarterly Journal of Economics」に論文の撤回を要請しています。arXivの規定では著者のみが論文の撤回を申請できるため、MITは著者に申請を指示したものの、声明発表時点では実施されていないと報告しています。
MITは「研究記録の正確性を重視する組織として、影響力のある研究が虚偽のまま流通することを避けるため、このような措置を取った」と述べています。なお、論文の著者は既にMITを離れているそうです。
論文中で謝辞として名前が挙がっていたDaron Acemoglu教授とDavid Autor教授は声明の中で、「この論文は査読付きの学術誌で発表されていないにもかかわらず、AIと科学に関する文献で広く知られ、議論されている。私たちは、この研究の妥当性に関して懸念を持ち、MITの適切な部門に報告した。MITは内部調査を行い、その結果、データの出所、信頼性、妥当性、そして研究の真実性に信頼が持てないと判断した。私たちは、この論文の結果が学術的または公共の議論で信頼されるべきではないと考えている」と述べています。
また、Autor教授はWall Street Journalの取材に対し、「ただ恥ずかしいだけでなく、胸が張り裂ける思いだ」と語っています。
・関連記事
科学者が10年かけてたどり着いた研究結果にGoogleの科学者向けAIアシスタントがわずか2日で到達 - GIGAZINE
AIを用いた研究でアルツハイマー病の原因解明へ一歩前進、新たな治療候補の特定を実現 - GIGAZINE
MetaのAI「Llama」を国際宇宙ステーションでの研究用に改造した「Space Llama」が軌道上へ配備される - GIGAZINE
人間とAIの「思考」に大きな違いがあることが研究で判明、AIは推論が苦手な可能性 - GIGAZINE
OpenAIがAIの論文理解&再現能力を評価するベンチマーク「PaperBench」を発表、人間とAIのどちらが研究開発力が高いのか? - GIGAZINE
・関連コンテンツ
in ソフトウェア, サイエンス, Posted by log1i_yk
You can read the machine translated English article MIT retracts paper claiming researchers ….