なぜGeminiが音声AI最強なのか? ChatGPT・Siriと決定的に違う1点
「OK Google、明日のフライトを調べて」——スマホに話しかけてAIが答えてくれるのは、もはや珍しいことではありません。しかし「調べた結果をもとに予約まで進めて」「ついでにYouTube Musicでプレイリストも流して」と頼むと、途端にできないことだらけ。AIアシスタントの"手足"の短さに、もどかしさを感じている方は多いのではないでしょうか。 そんな不満に対するGoogleの回答が、今週配信されたGemini Liveの大型アップデートです。対応する「Connected Apps」が一気に拡大し、音声AIアシスタントの実用性が大きく変わりそうです。
今回のアップデートは、「Neural Expressive」と呼ばれるデザイン刷新の一環として提供されています。最大の変化は、Gemini Liveがテキストチャットの画面に直接統合され、新しいフローティングインターフェースで動作するようになった点です。 これにより、テキストでサッと質問を打ち込んでから、そのまま音声での深い会話に切り替え、また必要に応じてテキスト入力に戻る——という操作が途切れなく行えるようになりました。「ちょっとした調べ物はキーボードで、込み入った相談は声で」という使い分けが、ひとつの画面の中で完結します。
これまでGemini Liveが連携できたのは、Googleの自社アプリではCalendar、Tasks、Keep、Mapsの4つだけでした。サードパーティとしてはSamsung、Honor、OnePlus、Oppo、Tecno、Vivo、Xiaomiが提供する同等アプリに対応していましたが、正直なところ「カレンダーとメモと地図しか使えないAI」では、日常のアシスタントとしては物足りない印象でした。 今回のアップデートで新たに加わったのは以下のサービスです。 Google自社サービス Home——スマートホームデバイスの操作 Hotels/Flights——宿泊先・航空券の検索 Workspace——GmailやGoogleドキュメントなど仕事ツールとの連携 画像生成——会話の中で画像を作成 Shopping——商品検索・比較 Utilities——タイマーやアラームの設定(Android限定) YouTube/YouTube Music——動画や音楽の検索・再生 サードパーティ Spotify——音楽ストリーミングの操作 この対応リストは、Web版のgemini.google.com/appsで確認できるものと同じです。つまりGemini Liveは、Geminiアプリ本体(オーバーレイ版)とほぼ同等の連携能力を手に入れたことになります。 ただし、現時点で1つだけ例外があります。Gemini Liveからメッセージを送信する機能はまだ実装されていません。これは2024年のMade by Googleイベントで「今後対応予定」として言及された機能であり、実現すればハンズフリーでのコミュニケーションがさらに快適になるはずです。
Page 2
「アプリが増えただけでしょ?」と思うかもしれません。しかし、AIアシスタントの価値は「どれだけ賢いか」だけでなく「どれだけ多くのことを実行できるか」で決まります。 たとえば旅行の計画を考えてみてください。これまでは「京都のおすすめホテルを教えて」と聞いた後、自分でブラウザを開いて検索し、別のアプリでフライトを調べ、カレンダーに予定を入れる——という手作業が必要でした。Hotels、Flights、Workspaceが連携した今、これらを音声だけで一気通貫にこなせる可能性が出てきたわけです。 Utilitiesの追加も地味ながら実用的です。料理中に「3分のタイマーをセットして」と声で頼めるのは、手が塞がっている場面では確実に助かります。
Gemini Liveの進化は、競合他社の動きと照らし合わせると、さらに意味が見えてきます。 OpenAIのChatGPTは「Advanced Voice Mode」で自然な音声会話を提供しています。無料ユーザーもGPT-4o miniベースで利用できますが、音声利用は1日2時間に制限されており、より長時間・高機能に使うには月額20ドルのPlusプラン以上が必要です。さらに2025年8月には「gpt-realtime」という、より表現豊かで自然な音声を実現する高度な音声モデルをリリースし、音声エージェント市場での競争力を高めています。 Amazonは2026年2月4日にAlexa+を全米で提供開始しました。Prime会員は追加費用なしで無制限に利用でき、非会員は月額19.99ドルという価格設定で、スマートホームとの連携に強みを持ちます。 MicrosoftもCopilotのVoice機能をWindows全体へ展開しており、2025年末には「Hey Copilot」によるハンズフリー音声起動を全Windows 11 PCへロールアウトしています。 そしてAppleは、6月8日のWWDC 2026でSiriの大幅リニューアルを発表する見込みです。注目すべきは、Appleが2026年1月にGoogleとのパートナーシップを発表しており、Geminiモデルを活用してSiriの刷新を進めると報じられている点です。かつてのライバルが手を組む構図は、この市場の複雑さを象徴しています。 Geminiモバイルアプリは現在世界150カ国以上で複数言語に対応しており、2026年4月にはGemini in Chromeが日本を含むアジア太平洋の7カ国で利用可能になるなど、Googleはプラットフォーム横断での展開を着実に進めています(※日本ではデスクトップ版のみで、iOS版の提供は先送りされています)。