科学的に正しい分子設計が可能な化学特化AI推論モデル「ether0」登場、既存の言語モデルに強化学習を施して人間や既存AIを上回る性能を発揮

ソフトウェア

科学技術向けのAIエージェントを開発する非営利団体のFutureHouseが、化学タスクに特化したAI推論モデル「ether0」を発表しました。ether0は「Mistral-Small-24B-Instruct-2501(Mistral Small 3)」をベースに強化学習を施したモデルで、分子に関する質問に高精度な応答を返すことができます。

ether0: a scientific reasoning model for chemistry | FutureHouse

https://www.futurehouse.org/research-announcements/ether0-a-scientific-reasoning-model-for-chemistry

TRAINING A SCIENTIFIC REASONING MODEL FOR CHEMISTRY

(PDFファイル)https://storage.googleapis.com/aviary-public/ether0_preprint.pdf OpenAI o3やClaude Opus 4といった推論モデルは「化学に関する質問を含むベンチマークテスト」で人間より高いスコアを記録することができます。しかし、「分子を扱う実用的な質問」に応答するのは苦手で、科学的にあり得ない分子構造を返答してしまうこともあります。この問題を解決するべく開発されたのがether0です。

ether0はMistral AI製の推論モデル「Mistral-Small-24B-Instruct-2501」をベースに強化学習と微調整を施したモデルで、分子に関する質問を高精度に処理することが可能です。「C27H37N3O4」の構造をether0(左)、OpenAI o3(中央)、Claude Opus 4(右)に出力させた結果が以下。OpenAI o3とClaude Opus 4は誤った構造を出力しましたが、ether0は科学的に正しい構造を出力できました。

以下のグラフはether0を含む複数のAIモデルや人間に化学に関する問題を解かせた際の正答率を示しています。グラフの中央から左側が自由記述形式の問題、右側が選択式問題の正答率を示しています。グラフを見ると、自由記述形式の問題ではether0が人間や他のAIモデルを圧倒する成績を残していることが分かります。

また、ether0は質問に対する直接的な回答に至るまでの思考内容も出力可能で、その内容は科学的に説得力のあるものだったとのこと。

Finally, the individual reasoning traces that come out of the model are also very compelling. Here it is backing out the chemical structure associated with a natural product. This is a hard task for humans. 4/n pic.twitter.com/3AzDeGfgUv

— Sam Rodriques (@SGRodriques) June 5, 2025

FutureHouseのCEOを務めるSam Rodriques氏はether0の注目すべき点として「特化型モデルと比べて効率的な学習が可能」という特徴を挙げています。以下のグラフは横軸が学習の進行度、縦軸が正答率を示しており、ether0が早い段階から高い精度を備えられていることが分かります。

ただし、ether0はあくまでプロトタイプモデルであり、「分子に関する問題以外では性能が低下する」「学習データの影響から、一部のタスクでは間違った回答を出力する」といった問題があるとのこと。それでも、Rodriques氏は「今回の研究のは、適切な学習データさえあれば、言語モデルが科学的課題において非常に効率的に超人的なパフォーマンスを発揮できることを示した概念実証と言える」とアピールしています。

This model is a prototype. It beats frontier models by a large margin on some tasks, but is relatively narrowly useful in those domains. It is trained for molecular design tasks, so it can only answer questions for which the answer is a molecule. Also, it is based on a 24B model,…

— Sam Rodriques (@SGRodriques) June 5, 2025

ether0のモデルデータは以下のリンク先で配布されています。

futurehouse/ether0 · Hugging Face

https://huggingface.co/futurehouse/ether0

また、以下のページでether0の動作を試すこともできます。

ether0 Chemical Reasoner

https://ether0.platform.futurehouse.org/
先ほど入力したメールアドレス宛に件名「GIGAZINE無料メンバー登録のメールアドレスの確認」というメールが送信されているので、「メールアドレスを確認するには、次のリンクをクリックしてください。」の部分にあるリンクをクリックして、認証を完了してください。メールが届いていなければ、この直下にある「確認メールを再送信する」をクリックしてください。

・関連記事 AIで科学研究を自動化するエージェントシステム「Robin」誕生、実際に科学的新発見を達成して2カ月半で論文を公開 - GIGAZINE

Metaが1億件以上の分子構造データを含む大規模量子化学データセット「OMol25」とAIモデル「Universal Model for Atoms(UMA)」をリリース - GIGAZINE

AIを用いた研究でアルツハイマー病の原因解明へ一歩前進、新たな治療候補の特定を実現 - GIGAZINE

Google DeepMind共同創設者のデミス・ハサビス氏らがノーベル化学賞を受賞、「AlphaFold」などタンパク質構造予測AIの研究が高く評価される - GIGAZINE

関連記事: