AIが現実世界でタスクを実行できるようになる──特集「THE WORLD IN 2025」

Skip to main content

AIはテキスト入力に基づいて画像や動画を生成できるようになった。今度は人間が暮らす物理世界で考えて動く「フィジカル・インテリジェンス」と呼ぶべきデバイスが登場するようになる。
Illustration: Carmen Casado

※雑誌『WIRED』日本版 VOL.55 特集「THE WORLD IN 2025」の詳細はこちら

世界中のビジョナリーや起業家、ビッグシンカーがキーワードを掲げ、2025年の最重要パラダイムを読み解く恒例の総力特集「THE WORLD IN 2025」。MITコンピューター科学・人工知能研究所所長のダニエラ・ラスは、物理世界の経験から学び、適応し続けるAIの登場は近いと請け合う。

最近の人工知能(AI)モデルは驚くほど人間に近い能力をもっており、入力したプロンプトに応じてテキストや音声、動画まで生成できるようになった。しかし、そのアルゴリズムはこれまでのところ、人間が暮らす3次元の物理世界ではなく、主にデジタル世界に属したままである。実際のところ、AIモデルを物理世界に適用しようとすると、最も高度なモデルでさえ適度に機能することにも四苦八苦する。例えば、安全で信頼性の高い自律走行車の開発がいかに困難だったかを考えてみてほしい。AIモデルは物理学をまったく理解していないだけでなく、ハルシネーション(幻覚)を起こすことが多く、不可解なミスを犯してしまうのだ。

こうしたなか2025年は、AIがついにデジタル世界から人間が暮らす物理世界へと飛躍する年になるだろう。AIをデジタル世界の枠を超えて拡張するには、機械に固有の思考方法を見直し、AIのデジタル知能とロボット工学の機械的能力を融合させていく必要がある。これはわたしが「フィジカル・インテリジェンス(物理的知能)」と呼ぶもので、環境を動的に理解し、予測不可能な状況に対処し、リアルタイムで意思決定できる新しい形態のインテリジェントなマシンである。標準的なAIで使用されるモデルとは異なり、物理的知能は物理学に根差しており、原因と結果の関連性といった物理世界の基本原理を理解できるようになっている。

こうした特徴をもつ物理的知能モデルは、さまざまな環境に相互作用し、適応できるようになっている。マサチューセッツ工科大学(MIT)でわたしが率いる研究グループでは、「リキッドネットワーク」という物理的知能モデルを開発している。

ある実験において、標準的なAIモデルで操作するドローンとリキッドネットワークで操作するドローンの2台を訓練し、人間のパイロットが入手したデータを使用して夏に森のなかで物体の位置を特定させたときのことだ。どちらのドローンも、訓練された通りのことを実行するよう指示されたときは同等のパフォーマンスを発揮したが、異なる状況(冬や都市環境)で物体の位置を特定するよう指示されたときは、リキッドネットワークのドローンだけがタスクを完了できた。この実験からわかったことは、最初の訓練段階が終わると進化が止まってしまう従来のAIシステムとは異なり、リキッドネットワークは人間と同じように経験から学び、適応し続けるということである。

さらに物理的知能は、テキストによるプロンプトや画像から得られる複雑なコマンドを解釈し、物理的に実行可能で、デジタル世界における指示と物理世界での実行のギャップを埋めることもできる。例えば、わたしの研究室では「前へ歩けるロボット」や「物を掴めるロボット」といったプロンプトに基づいて小型ロボットを1分以内に繰り返し設計し、3Dプリントできる物理的知能システムを開発した。

わたしたちだけでなく、他の研究室も大きなブレークスルーを達成している。カリフォルニア大学バークレー校の教授であるピーター・アビールが共同創業したロボット工学スタートアップのCovariantは、プロンプトに応じてロボットアームを制御できるChatGPTに似たチャットボットを開発している。同社はすでに仕分けロボットを開発し、世界中の倉庫に配備すべく2億2,200万ドル(約340億円)以上の資金を確保している。

カーネギーメロン大学の研究チームも最近、強化学習で訓練されたひとつのニューラルネットワークを使用して、たった1台のカメラと不正確な作動装置しか搭載していないロボットが、ダイナミックで複雑なパルクール(身長の2倍の高さの障害物に飛び移ったり、全長の2倍の長さのギャップを飛び越えたりする動作など)をこなせることを実証した。

2023年がテキスト入力による画像の生成、24年が動画の生成の年だったとすれば、25年は物理的知能の時代になる。ロボットだけでなく、送電網からスマートホームまで、人間からの指示を解釈して物理世界でタスクを実行できる新世代のデバイスが登場することになるだろう。

ダニエラ・ラス | DANIELA RUSマサチューセッツ工科大学(MIT)コンピューター科学・人工知能研究所(CSAIL)所長。ロボット工学やモバイルコンピューティングが専門。マッカーサーフェローに選ばれた経験がある。コーネル大学で博士号を取得。

(Originally published in the January/February 2025 issue of WIRED UK magazine, edited by Daisuke Takimoto)

Related Articles

雑誌『WIRED』日本版 VOL.55「THE WIRED WORLD IN 2025」

『WIRED』の「THE WIRED WORLD IN 20XX」シリーズは、未来の可能性を拡張するアイデアやイノベーションのエッセンスが凝縮された毎年恒例の大好評企画だ。ユヴァル・ノア・ハラリやオードリー・タン、安野貴博、九段理江をはじめとする40名以上のビジョナリーが、テクノロジーやビジネス、カルチャーなど全10分野において、2025年を見通す最重要キーワードを掲げている。本特集は、未来を実装する者たちにとって必携の手引きとなるだろう。 詳細はこちら

関連記事: