歴史を変える可能性を秘めたアマゾンエコー
http://wedge.ismedia.jp/articles/-/11070
2017年11月9日 多賀一晃 (生活家電.com主宰) WEDGE Infinity
話題のAmazon Alexa / Echo(以下 Amazonはアマゾン、Alexaはアレクサ、Echoはエコーとカタカナ表記)が日本に正式に上陸。発表された。カテゴリーはAIスピーカー。日本でも何社かは既に発売しているが、本家はアマゾンだ。世界を席巻しつつある。何がスゴいのかレポートしたい。
アマゾンエコー
最近のAI
AIとは、artificial intelligence。日本語で人工知能、耳に馴染むようなったが、おさらいしておくと、コンピューター(計算機)に人間の脳と同じ働きをさせようと言うことだ。概念ができたのは1956年。アメリカはジョン・マッカーシー博士の「コンピューターで推論・探索することで、問題を紐解く」という提案だ。概念としてはありなのだが、これは何もないところから、問題を解決させろと言うことと同じで、人間も「大天才」にしかできない。当然、コンピューターもできないことをさせようとしたのと同じ。AI黎明期の話だ。
普通の人間は、行動し、学び、教育により知識を得て、初めていろいろなことができるのが一般的。「コンピューターに知識を与えてしまえ!」というのが次の段階。しかし、必要十分な知識(データー)をコンピューターに与えるのは大変、というより自分の人生が、コンピューターに知識を与えるだけで終わったり、与える途中で終わったりする可能性もあると言うことで、AIには宙ぶらりんの状態が続くことになる。
これが変わったのが2012年。カナダのトロント大学のチームが出した「マシン・ラーニング(ディープ・ラーニング)」だ。インターネット上のビッグデーターを元に、コンピューター自身が学ぶ仕組み。例えば、人には分かってもコンピューターには分からなかった、「あれやって、これやって」という曖昧な指示を、コンピューターが理解できるようになったわけだ。
2009年の細田守監督の名作映画「サマーウォーズ」の中に、謎の人工知能「ラブマシーン」が出てくる。インターネット上のアカウントを次々自己に取り込み、ネット上では、無限の能力を持つ存在として描かれている。しかし「ラブマシーン」を開発した侘助は「ラブマシーン」を「ハッキングAIに「好奇心」をプログラムしただけ」と解説している。好奇心=自己学習。これもトロントのチームと同じだ。
ビッグデーターを持つアマゾンがAIに手を伸ばすのは当たりまえのことだ。
何をAIに勉強させたのか?
アマゾンは、何をAIに勉強させたのかと言うと「言語」。アマゾンはビッグデーターを使い自社のAWS(アマゾン・ウェブ・サービス)クラウドコンピューターに「言語」のマシン・ラーニングをさせたわけだ。単語、一つ一つはもちろん、組み合わせから、次のフレーズを予想し、文の意味を掴むことまで。日本語は、同音異義語が多いので難しい。省略語などは、関東が「マック」関西が「マクド」と言うように、地方でも違う。これに方言が加わると、場合によっては日本人同士でも通じないことがでてくる。それを勉強させたわけだ。
また、文の意味を間違いなくつかむと言うことは、日本文化などの知識も持っていなければならない。例えば「お正月」が分からなければ、日本では年明けの会話が通じない。言語だけでなく文化風俗も各地域ごとに学ばせるわけだ。また会話ができないと、一方通行のコミュニケーションとなるため、話もできるようにする。しかし、電車のアナウンスのようでは、聞き取りにくいため、日本人ぽく喋ることも重要。
アレクサの声は落ち着いた女性の声。日本でありがちなアニメ声ではなかった。落ち着いているので、どことなく有能な秘書を感じさせる。
なくてはならない声によるヒューマン・インターフェイス
コンピューターと人間が付き合うには、ヒューマン・インターフェイス(Human Interface)が必要。ヒューマン・インターフェイスとは、人とコンピューターはどうやって情報をやり取りするのかということ。いろいろな種類がある。リモコンもそうだし、その延長線上で「スマホ」もそう。どちらかと言うと操る感じだ。
日本では、このイメージを脱していなくて、モノ(システム)を操る場合、ディスプレイが付いたものが基本だ。
しかし、未来はどうだろうか? 高齢化社会になった場合、若い頃のように、スマホを使えるだろうか? 答えは当然「ノー」だ。人は言葉でやり取りする。その昔、文字を知らなくて一生を終える人もいっぱいいた。その人たちは、不幸だったかというとそうではない。結婚もしたし、仕事もして、精一杯人生を生きた。
が、しゃべれなくなったらどうだろうか? 一気に厳しくなる。その位、言葉でのコミュニケーションは人として基本中の基本のコミュニケーションでもある。人は死ぬ間際に、声は出せても、余り文字は書かない。そう書くと声、会話で、コンピューターをやり取りするのは、リモコン、スマホで動かすより、自然であることがお分かり頂けるだろうか?
寺子屋の学習は「読み、書き、そろばん」だった。元々計算機(そろばん)のコンピューターが、「タッチパネル(スイッチ、キーボード)」「音声認識(アレクサ)」で人に近づいたと考えることもできる。
この音声(認識)サービスが「アレクサ」だ。会話を通じて、ユーザーは情報を仕入れたり、音楽を聴いたり、家電にいろいろなことをさせることができる。
一方、「アレクサ」は、動画プレイヤーで「Blu-ray」対応と表示されるような、「規格」のようなものでもある。この規格がデファクトとなれば、大きなビジネスになることはお分かり頂けると思う。
簡単な構造、求めやすい価格
そのアレクサに対応したスピーカーが、アマゾン エコー シリーズだ。Echo(エコー、11,980円(税込))、Echo.Dot(エコードット、5,980円(税込))、Echo Plus(エコープラス、17,980円)の3種類がある。
エコーを例に簡単に構造を説明したい。再生を受け持つのは、2.5インチのダウンファイアーウーファーと、専用ツイーター。それにDolby プロセッシングが加わる。360° 全方位対応型。
この手のスピーカーに音質を期待してはいけないのは、オーディオマニアの常識だが、試聴してみると、BGM以上のレベルと言える。
そして聞き取りは、7つのマイクアレイとビームフォーミング技術とノイズキャンセレーション技術を用いている。ビームフォーミング技術とノイズキャンセレーション技術は、人が話しかけられたとき、人の声に集中することと同じだ。声の方向に集中し、他の音を無意識の内にカットする。このため、エコーは、部屋のどこから声を掛けても的確に答えてくれる。
アマゾンエコードットは、「中継」を意識した作りで、Bluetooth、3.5mmステレオケーブルで、外部スピーカーと接続できる。その他機能はエコーと同じだが、エコーの半分しか高さがない。音の試聴はまだだが、エコーより再生音は落ちる可能性はある。
アマゾンエコードット
アマゾンエコープラスは、エコーにホームシステムへの接続機能が内蔵されている。IFA2017では、独ミーレが、エコープラスを起点に、システムコントロールする術をデモしていたし、韓LGでも、エコープラスへは対応するとしていた。自社で音声認識システムを作るのは、巨額な投資が必要なため、音声システムを自社開発できないメーカーは、デファクトになりそうな機種をケアする必要がある。
なお、会場のデモは、フィリップス社のスマートライト「Hue」のZigBee(家電向けの短距離通信技術のひとつ)対応製品で行われた。このエコーシリーズ、価格もリーズナブルであり、ヒットしない理由がない。
第一印象
話しかけは「アレクサ」から始まる。「アレクサ、ジャズを聴かせて!」というとアレクサは、「アマゾン ミュージックのジャズ ステーション ジャズ」と話し、続いてジャズが始まる。
2017 11 08 Amazon Echo
このアレクサは、先方が決めた数語には置き換えられるモノの、各個人がオリジナルの名前を付けることはできないそうだ。
「アレクサ、今日の天気を教えて!」「本日、南平台(発表は渋谷の南平台で行われました)の天気は、曇り、時々雨が降ります」
「アレクサ、今日のニュース教えて!」「1時のNHKニュースです……」
スゴいと思ったのは、「今年の日本シリーズの結果を教えて」の問い。これはいろいろな答えが考えられる。第1試合の結果が返ってきても、日本シリーズの結果だ。このような質問は曖昧さを残すものとして、昔は受け付けないことが多かった。
エコーの答えは「ソフトバンク4勝、DeNA 2勝で、ソフトバンクが優勝」。ちょっと唸った。
続いての「大相撲 九月場所の結果を教えて!」「平成29年の9月場所は、日馬富士が豪栄道を寄り切りで破り、優勝しました。御嶽海は嘉風をはたき込みでやぶり……」。優勝はともかく、通常は下位から読み上げていくのが通常。上位から読み下げられるという珍しい経験をした。細かいが、これは違和感を覚えた。
「早口言葉喋って」の時、テープの早廻し再生のように甲高い声で喋られたのには笑った。
わからないことには、「すみません、よくわかりません」等々。
この手の製品はいろいろあるが、実用に足り、シンプルで飽きが来なさそうというのが、第一印象だった。
アマゾンが同日発表した新サービス
一つは、Amazon music unlimited(アマゾン ミュージック アンリミテッド)です。音楽配信サービスですが、エコーとの相性がいい。「アレクサ、スピッツかけて」「アレクサ、きゃりーぱみゅぱみゅのアルバムかけて(アレクサは「きゃりーぱみゅぱみゅ」噛んでました)」とか、「アレクサ、この曲名は何?」とか、全部に答えを返してくる。価格も魅力的だ。個人で980円/月だが、プライム会員だと780円/月。また7800円/年。エコーを持っているとエコー会員は380円/月。もちろん、スマホなどの端末でも楽しめる。
もう一つは「スキル」。スキルとは、アレクサに対応したアプリのことだ。アマゾンはプラットフォーム貸しなので、いろいろなメーカーがアレクサを使いスキルを作る。しかし、今の時点で、265スキルあるのは驚いた。導入で、日本語でこれだけあるとかなりのことができる。同日はスキル作成のサポートも発表された。
発表会後、家に帰るまでに、日立から「オーブンレンジ『ヘルシーシェフ』とロボット掃除機「ミニマル」がアレクサに対応した」こと、iRobotから「『ルンバ』がアレクサに対応した」と連絡が来た。また「『ぐるなび』からも対応しました」と来た。昔、あるメーカーの似たシステムで、レストラン検索ができますと言われたが、検索結果が少なく、まだその部分は使えないと判断したことがある。スキルの多いエコーでは、そんなことはなさそうだ。
IoTが当たり前になりつつあるこの時代、一世代を築くかも知れない。