生成AIで世代交代するAmazonデバイス 「日本語化」でなく「日本対応」
Amazonが新しいデバイス群を発表した。筆者はニューヨークで開かれた発表会に出席し、戦略の詳細を取材してきた。
中核になるのは、Alexaを生成AIで作り直した「Alexa+」だが、日本での提供時期はまだ公開されていない。
ただし、それだけが注目すべきところではない。
Amazonは以前より「アンビエント・インテリジェンス」という考え方を推進している。それがどういうものなのか、新デバイスの持つ機能や思想から考えてみたい。
2025年2月、AmazonはAlexaを刷新し「Alexa+」に切り替えていくことを発表していた。Alexa+は有料であり、月額20ドル。Amazon Prime会員は無料という扱い。そのため実際には「併存」というべきなのだが、それでも、今後同社のAIアシスタントがAlexa+を軸にしていくことは間違いない。
発表から半年以上が経ったが、この間はアメリカで招待者のみ、少数が利用する状態だった。今回、新製品の発表に伴い「アーリーアクセス」に移行し、申込者には数週間の間にサービスが提供されることになった。ただし、新製品である「Echo Dot Max」「Echo Studio」「Echo Show 8」「Echo Show 11」の購入者は、最初からAlexa+が使えるという。
Alexa+は生成AIをベースにしており、人間との対話が非常に滑らかになる。エージェント性も備えており、会話の先でショッピングやチケットの購入、ライドシェアの予約などもできる。
Amazonでハードウェア事業のトップを務めるパノス・パネイ氏は「食卓の様子が変わった」と話す。
それまでは事あるごとにスマホを取り出していて会話が途切れがちになったというが、Alexa+を自宅で使うようになってから、質問はAlexa+にするようになった。結果として、Alexa+が家族の1人のように会話に参加するようになったので、食事がスマホで分断されることがなくなった……というのだ。
少々極端な話にも見えるが、これまでのAlexaのように「音声リモコン」に近い挙動から、「スムーズに会話にできるAI」になるとすれば、確かにそんなことも起きるかもしれない。
新しいEchoシリーズではAmazonオリジナルのプロセッサーである「AZ3」シリーズが搭載される。AZ3では、マイクのノイズキャンセル機能や機器同士の連携による対話機能が改良されるといい、今までよりも声を正確に聞き取れるようになる。
現状、Alexa+はアメリカだけで提供されている。日本を含む多数の国に向けて開発が進められているのは間違いないのだが、提供時期は公開されていない。
前出のように、Alexa+は生成AIをベースとしている。そのため、他の生成AIと同じように、言語を超えるのは難しくない。ChatGPTがアメリカでも日本でも同時にサービスを提供しているのは、生成AIが「言語を超えやすい」からでもある。
だが、Amazonはそう考えてはいないようだ。
ポイントは「日本語化ではなく日本向けサービスである」という点にある。
生成AIにはある種のモノカルチャー性がつきまとう。多くのAIモデルは、英語や中国語などのデータを多く使って学習している関係で、内在する情報がその言語を使う文化圏のものに偏りやすいのだ。習慣の違いや敬語の使い方などにそれが現れる。
だが、前述のようにAlexa+は「家庭内で自然に使われる」ことを想定している。「日本語には堪能だがアメリカ文化的な反応を返す」のでは目的に合わない。
さらに、各国で連携すべきサービスも変わる。
Alexa+を搭載したFire TVでは、テレビ番組からストリーミングサービスまで、多数の番組を検索可能になる。そこでどのサービスと連携するかは、当然国によって変わってくる。
さらに、どんな機器と連携するかも変わる。日本やインドでは赤外線リモコン連携が多数使われるが、他国ではそうでもないのだという。
ショッピングやチケットサービスでも地域パートナーとの連携が必要になるし、そこで必要な決済サービスも変わる。
Alexa+は家庭内で使うものであるだけに、「日本語化」ではなく、日本の環境に合わせた「日本対応」が必要になるわけだ。
だから、AIモデルに存在する言語依存の偏りを是正する技術や、ローカルなパートナーとの連携の積み重ねが必要であり、軽々に対応時期を発表できない……という事情があるのだ。
この点は、一般的なAIサービスと異なる部分であり、その徹底度が、最終的な評価につながるだろう。
Amazonは色々なところでAIを活用する。
特に筆者が面白いと感じたのは、セキュリティカメラである「Ring」でのAI活用だ。
アメリカではRing向けに「スマートビデオサーチ」という機能が提供されているのだが、それがドイツ・フランス・スペイン・オランダで提供を開始した。
日本はまだだが、「準備が整い次第アナウンス」(Amazonジャパン広報)するという段階。すなわち提供予定がある、ということだ。
この機能は、Ringで撮影した過去の映像を「文章で検索可能」にするもの。画像に映ったものをAIが分析し、文章での検索とマッチングすることで実現される。
すぐに思いつくのは「置き配を見つける」とか「怪しい人がきたタイミングを見つける」ことだが、Amazonはまた別の使い方も提示した。
それは「自宅近くで家族が触れ合うシーンを見つける」ことだ。例えば、庭で子供が遊ぶ様子や、両親・友人などが自宅を訪ねてきた様子、ペットが家の周りをうろついている様子など、映像として残るものの価値を問い直そう、というものだ。
家族を含めた、見知った人々の顔を認識し、スマホに通知する「Familiar Faces」といった機能も搭載される。
セキュリティカメラは重要な市場だが、前向きに「買いたくてたまらなくなる」製品というよりは、どうしても必要になって買うものだ。そこに家庭向きの味付けの機能を搭載することは、より前向きな気持ちで購入を促せる。
高画質な4Kモデルも投入されたが、それもセキュリティのためだけでなく「思い出のため」となれば、購買意欲も高まるというものだ。
もちろんAlexa+と連動するので、テレビなどで大きく映して楽しむこともできる。プラットフォームとしての価値を高めることで、他社との差別化を図っているわけだ。
もう一つ、AI機能という面で興味深い機能もあった。
今回、手書き対応の「Kindle Scribe」もリニューアルした。
その中で発表されたのが「Story So Far」という機能だ。これは、読んでいる本の途中までのあらすじをまとめて提供するもの。もちろん、読んでいない部分は対象としないので、ネタバレはしない。同じ本の中だけでなく、「これまでのシーズン」「第3シーズンまで」といったまとめ方もできるのが面白い。
もう一つ「Ask this Book」という機能もある。これはテキストの一部をハイライトすることで、登場人物の動機やそのシーンの重要性などに関する質問をできる機能。こちらも先の展開には触れず、ネタバレなしで答える。
担当者は長編ファンタジー・シリーズやSFのファンであるらしく、途中でストーリーがわからなくなるのを防ぐ機能として紹介された。確かに筆者も欲しい。電子書籍らしさを活かす機能としては非常に魅力的であり、生成AIがなければ実現できない機能だ。
これらの機能は残念ながら英語のみの機能であり、日本では提供の予定などは公開されていない。
また、新型のKindle Scribeも現状、日本市場への投入時期は未定だ。
どちらも残念だが、Kindleにも変化がやってきたことを感じさせるものでもある。
Amazonは想像以上に、同社製品を「生成AIありき」にしてきている。
同社にはスマートフォンがないし、派手な動画生成などもやらない。現時点では利用できる人も少なく、どこまで進化したのかが見えづらいため、話題にもなりづらい。
しかし、大手だけに裏ではかなり積極的な開発を進めており、それがようやく製品の形をとって表に見え始めた……というところなのではないだろうか。