AIは動物の会話を翻訳できるか──特集「THE WORLD IN 2025」
※雑誌『WIRED』日本版 VOL.55 特集「THE WORLD IN 2025」の詳細はこちら。
世界中のビジョナリーや起業家、ビッグシンカーがキーワードを掲げ、2025年の最重要パラダイムを読み解く恒例の総力特集「THE WORLD IN 2025」。動物学者のリク・カーシェンバウムは、動物がどれだけコミュニケーションをしているかだけでなく、話している内容まで理解できるようになるかもしれないと期待を寄せる。
2025年、人工知能(AI)と機械学習を活用した動物とのコミュニケーションが本格化し、人間にとって長らく謎だった「動物は何を話しているのか?」という疑問の答えを知ることになるだろう。
近年、コラー・ドリトル賞が、「コードを解読」した科学者に最高50万ドル(約7,600万円)の賞金を提示しているのは、機械学習と大規模言語モデル(LLM)の技術的進歩によって、その目標が達成可能なところまできていることの表れだ。
多くの研究グループが、動物の鳴き声を理解するためのアルゴリズムの開発に長年取り組んできた。例えばプロジェクトCETIは、マッコウクジラのクリック音やザトウクジラの歌を解読してきたが、こうした解読に使われる最新の機械学習ツールには膨大なデータが必要となる。これまでずっと、こうした学習のための高品質かつ注釈豊富なデータは足りていなかったのだ。
関連記事:マッコウクジラのコミュニケーション解読に挑む:プロジェクトCETIが目指す動物言語の“Google翻訳”
OpenAIが開発したChatGPTのような、インターネット上で利用可能なすべてのテキストを含むトレーニングデータを活用できるLLMを考えてみてほしい。こうしたツールも、以前であれば、動物とのコミュニケーションに関する情報にアクセスすることはできなかった。例えば、GPT-3の訓練には500GB以上単語が使用されたのに対して、最近プロジェクトCETIが行なったマッコウクジラのコミュニケーションに関する分析では、8,000ちょっとの「コーダ」(発声)しか使用されていない。これは、人間のデータコーパスが、利用可能な野生動物のデータに比べて桁違いに大きいということだけを意味するわけではない。
人間の言語を扱う場合、わたしたちはすでにその意味を知っている。「単語」の構成要素さえ知っているのだ。これは動物のコミュニケーション翻訳に比べて大きなアドバンテージである。例えば、特定のオオカミの遠吠えがほかのオオカミの遠吠えとどう違うのか、科学者たちにはほとんどわからないし、オオカミ自身が自分たちの遠吠えを、人間の言語における「単語」に相当するものとして考えているかどうかも、そもそもわかっていない。
関連記事:AIは動物の“言葉”をどこまで翻訳できるのか? 鍵となる世界認識と語彙の違い
根本的な疑問は残されたまま
それでも2025年には、動物のコミュニケーションに関して科学者たちが利用できるデータ量と、それらのデータに適用できるAIアルゴリズムの種類と能力の双方が、大きく進歩するだろう。動物の鳴き声の自動録音は、「AudioMoth」などの低価格録音デバイスが一気に普及したことで、すでにどの科学研究グループも手軽に活用できるようになっている。
現在、大規模なデータセットがネット上で利用可能になりつつあり、そうなれば、レコーダーを現場に置いたままで、ジャングルのテナガザルや森の鳥たちの鳴き声を長期間にわたっていつでも聞けるようになるだろう。これまでであれば、こうした大規模なデータセットを手動で管理するのが難しい場合もあったが、現在では「畳み込みニューラルネットワーク」に基づく新たな自動検出アルゴリズムによって、数千時間分の録音のなかから動物の鳴き声を拾い出し、それらを自然の音響特性に応じてさまざまなタイプに分けることができる。
こうした大規模な動物のデータセットが利用できるようになれば、新たなアルゴリズムを使った分析が可能になり、ディープニューラルネットワークを活用して、人間の言語構造に類似した、動物の発声シーケンスに隠された構造を見つけることもできるかもしれない。
とはいえ、動物の鳴き声を使ってわたしたちは何をしたいのか、という根本的な疑問は残されたままだ。Interspecies Internetなど一部の組織は「ある種からの信号を別の種のコヒーレント信号に変換すること」とそのゴールを明確に設定している。言い換えれば、動物間のコミュニケーションを人間の言語に翻訳するということだ。しかし、ほとんどの科学者は、人間以外の動物は独自の言語を ── 少なくとも人間が使うような言語を ──もっていないという意見で一致している。
関連記事:動物が知覚している奇妙で計り知れない環世界を、その絶滅より前に人間は理解できるだろうか
コラー・ドリトル賞はもう少し洗練されていて、「生物とコミュニケーションを取る、あるいはそのコミュニケーションを解読する」方法を探している。実際には動物が翻訳できる言語をもっていない可能性を考慮すると、解読のほうが現実的かもしれない。いまのところ、動物同士がどの程度情報を伝達し合っているのかはわかっていないが、2025年、人類は動物がどれだけ話すかだけでなく、話している内容まで、一足飛びに理解できるようになるかもしれない。
アリク・カーシェンバウム|ARIK KERSHENBAUM動物学者。動物のコミュニケーションを専門とし、ケンブリッジ大学ガートン・カレッジで研究員を務める。著書に『まじめにエイリアンの姿を想像してみた』、最新刊に『Why Animals Talk』(未邦訳)がある。
(Originally published in the January/February 2025 issue of WIRED UK magazine, translated by Eriko Katagiri/LIBER, edited by Michiaki Matsushima)
Related Articles
雑誌『WIRED』日本版 VOL.55「THE WIRED WORLD IN 2025」 は2024年12月17日に発売!
『WIRED』の「THE WIRED WORLD IN 20XX」シリーズは、未来の可能性を拡張するアイデアやイノベーションのエッセンスが凝縮された毎年恒例の大好評企画だ。ユヴァル・ノア・ハラリやオードリー・タン、安野貴博、九段理江をはじめとする40名以上のビジョナリーが、テクノロジーやビジネス、カルチャーなど全10分野において、2025年を見通す最重要キーワードを掲げている。本特集は、未来を実装する者たちにとって必携の手引きとなるだろう。 詳細はこちら。