グーグルが投資額6倍で「AIエージェント全力投球」。チャットで仕事が終わるGoogle Cloudの新戦略
そもそも、グーグルが全力投球を決めた「AIエージェント」とはどのようなものだろうか。 複数の定義があるが、ここでいうAIエージェントは「持続型」「長期駆動型」と呼ばれるものが多い。企業の中で特定のニーズを満たすために動き続け、指示に合うような作業を続けるAIだ。 AIが特定の何かを生成する、という仕事ではなく「人間に作業をお願いする」のに近い形だ。 人間と違うのは、細かい作業単位でエージェントが動いていて大量に存在すること、そして、文字通り「持続的」に動き続けることだ。 その結果として、AIを必要とするタスクはさらに増え、AIの推論処理ニーズは拡大する。AIを作るための学習処理も、まだまだ続く。規模は大きくなる一方だ。 クリアンCEOは「巨大な演算資源を持ち、フロンティアモデル(最新・先端のAI)を持つ企業だけが、独自のプロセッサーを含めた統合的な環境を提供できる」と語る。 グーグルは独自のAI処理用プロセッサーである「TPU」シリーズを作っている。2026年も最新版である「TPU 8」を発表したが、今回初めて、学習用(TPU 8t)と推論用(TPU 8i)にプロセッサーを分けて発表した。 クリアンCEOは記者とのラウンドテーブルセッションで、プロセッサー戦略について次のように答えた。 「長い期間をかけて作ってきたので2026年特有の傾向というわけではない。学習と推論は著しく異なる用途なので、それぞれを分けた。そして、それぞれの規模がどんどん大きくなる傾向がある」(クリアンCEO) 特に推論用の「TPU 8i」については、最大1152個のチップを相互に接続しつつ、通信負荷の高いワークロードの遅延を最大50%改善している。大規模な推論処理の応答が遅れることを改善しようとしているわけだ。