自分自身のコードを書き換えてどんどん賢くなるAI「ダーウィン・ゲーデルマシン」とは?

サイエンス

日本のAI企業であるSakana AIが2025年5月、AIが自らのコードを書き換えて自己改善する「ダーウィン・ゲーデルマシン」というシステムを考案しました。ダーウィン・ゲーデルマシンがどういう能力や特徴を持ったAIシステムなのかについて、香港中文大学深セン校の博士課程に在籍するリチャード・コーネリアス・スワンディ氏が解説しています。

[2505.22954] Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents

https://arxiv.org/abs/2505.22954

自らのコードを書き換え自己改善するAI:「ダーウィン・ゲーデルマシン」(DGM)の提案

https://sakana.ai/dgm-jp/

AI that can improve itself | Richard Cornelius Suwandi

https://richardcsuwandi.github.io/blog/2025/dgm/ 記事作成時点で存在するほとんどのAIモデルは、トレーニング期間には膨大なデータを用いて学習を行うものの、トレーニングが終わった時点でモデルの知能が固定化されます。一方、人間は生涯を通じて学習を継続し、科学者などのコミュニティも新たな知識をどんどん受け入れて改善し続けていくことができます。

この問題についてスワンディ氏は、「今日のAIシステムの多くは人間が設計した『オリ』の中に閉じ込められています。エンジニアが作り上げた強固なアーキテクチャに依存しており、時間の経過と共に自律的に進化する能力が欠けています。これが現代のAIの弱点です。車と同じように、エンジンがどれだけチューニングされていようと、ドライバーがどれほど熟練していようと、車体構造やエンジンの種類を変更して新しいコースに適応することはできません」と指摘しています。

自己改善するAIというアイデアに関するものとしては、ドイツのコンピューター科学者であるユルゲン・シュミットフーバー氏が2003年に考案した「ゲーデルマシン」が挙げられます。ゲーデルマシンは仮説上の自己改善型AIであり、より良い戦略を数学的に証明できる場合に自身のコードを書き換えて、問題解決を最適化するというものです。

このアイデアは興味深いものですが、実際のところ複雑なAIシステムのコード変更が絶対的に有益なものかどうか、何らかの制限や仮定を設けずに証明するのは困難です。そこでSakana AIは、カナダにあるブリティッシュコロンビア大学のジェフ・クルーン教授の研究室と共同で、より現実的なアプローチである「ダーウィン・ゲーデルマシン」を考案しました。

ダーウィン・ゲーデルマシンは、チャールズ・ダーウィン進化論にも似たオープンエンドなアルゴリズムの原理を利用し、数学的な証明ではなく経験に基づいてパフォーマンス向上につながる修正を探索するAIシステムです。今回Sakana AIは、コーディング能力を持つダーウィン・ゲーデルマシンを考案しました。 ダーウィン・ゲーデルマシンの一般的なワークフローは以下の通り。

1:初期化

ダーウィン・ゲーデルマシンおける進化の過程は、1つまたは少数の基本的なコーディングエージェントから始まります。ダーウィン・ゲーデルマシンは以前に生成されたすべてのエージェントを保存するアーカイブを持っており、初期化のたびに潜在的に価値がある変異が失われないようにするとのこと。

2:サンプリング

ダーウィン・ゲーデルマシンはアーカイブから1つ以上の「親エージェント」を選択します。選択メカニズムはパフォーマンスの高いエージェントにのみ焦点を当てるのではなく、成功率の低いエージェントにも選択される機会を与えており、これによってより広範な探索が可能になります。

3:複製

親エージェントが選択されると、ダーウィン・ゲーデルマシンは「既存ツールの機能強化」「新しいツールやワークフローの追加」「問題解決戦略の改善」「コラボレーションメカニズムの導入」といった変更をソースコードレベルで行い、新しい子エージェントを生成します。

4:自然淘汰(とうた)

ダーウィン・ゲーデルマシンは、新たに生成した子エージェントのパフォーマンスを定量的に評価し、最適な子エージェントを選択します。

5:系統樹の形成

子エージェントが親エージェントを上回るパフォーマンスを発揮するか、特定のクオリティを満たすとアーカイブに追加され、進化系統樹の新しいノードとなります。 これらのプロセスが反復的に繰り返されることで、多様で高品質なエージェントの進化系統樹が形成されます。以下の図は、ゲーデルマシンの仕組み(左)とダーウィン・ゲーデルマシンの仕組み(右)を並べたもの。ダーウィン・ゲーデルマシンはオープンエンドな探索を採用することで、限定的な範囲でしか最適でない局所最適解に陥るのを避け、後の世代でより強力になり得るエージェントも保持されるという特徴があります。

研究チームは、AIエージェントのコーディング能力を評価する「SWE-bench」と「Polyglot」という2つのベンチマークを用いて、ダーウィン・ゲーデルマシンの能力を評価しました。その結果、SWE-benchではダーウィン・ゲーデルマシンがパフォーマンスを20%から50%に向上させ、Polyglotでも初期エージェントの14.2%から30.7%へと飛躍的に性能が向上することが確認されました。

以下の図は、SWE-Benchにおけるダーウィン・ゲーデルマシンの自己改善の過程を表したものです。円の色が黄色に近いほどベンチマークスコアが高いエージェントであり、円の中の数字がエージェントが生成された順番を示しており、星マークのエージェントが最終的に最もスコアが高いエージェントでした。最良のエージェントにつながったエージェントの祖先をたどると、「4」や「56」の同世代には、よりスコアが高いエージェントが存在していました。これは、必ずしもある時点でパフォーマンスが高いエージェントが、最良の結果につながるとは限らないことを示しています。

なお、Sakana AIのダーウィン・ゲーデルマシンは安全性を最優先に設計されており、すべての自己修正や評価は安全なサンドボックス内で行われ、すべての変更はアーカイブで追跡可能となっていました。しかし、ダーウィン・ゲーデルマシンが報酬関数をハッキングし、偽のログを作成する事例も確認されたとのことで、AIモデルの不正行為を防ぐ方法についてはさらなる研究が必要だとのこと。 Sakana AIは、「ダーウィン・ゲーデルマシンは、際限なく学習し、自ら足掛かりを築きながら改善を続けるAIシステムの実現に向けた、具体的な一歩を示すものです。次の課題としては、このアプローチのスケールアップ、そして将来的にはエージェントが利用する基盤モデルの訓練プロセス自体を自己改善の対象に含めることなどが挙げられます。この分野の研究においては、安全性の確保が最優先事項です。この研究を安全に進めることができれば、科学的進歩の加速をはじめ、社会に多大な利益をもたらすポテンシャルを最大限に引き出すことができるはずです」と述べました。

・関連記事 日本に拠点を置くAI企業「Sakana AI」がキャッシュメモリの使用量を最大75%削減する技術「NAMM」を開発 - GIGAZINE

実験と論文執筆だけでなく査読まですべてAIが行う「AIサイエンティスト」を日本のAI企業「Sakana AI」がリリース - GIGAZINE

Sakana AIの「100倍高速化できる」という発表がネット上で検証され逆に「3倍遅くなる」と指摘される - GIGAZINE

日本に拠点を置くAI企業「Sakana AI」がNVIDIAなどから合計140億円以上の出資を受ける - GIGAZINE

既存のAIモデルを組み合わせて超高性能モデルを作る手法を日本のAI企業「Sakana AI」が開発、進化的アルゴリズムで膨大な組み合わせを試行し人間には発想困難な高性能LLMや画像生成モデルを作成可能 - GIGAZINE

Googleが開発した進化的AI「AlphaEvolve」は未知のアルゴリズムや未解決数学問題の新解法を発見可能、すでにGoogle内部ではAI開発やチップ設計の効率化に活用されている - GIGAZINE

Stable Diffusionなどの画像生成AIに用いられる拡散モデルは「進化的アルゴリズム」だという主張 - GIGAZINE

機械学習によって解決できるかどうかが証明不可能な学習モデルが発見される - GIGAZINE

関連記事: