デザイン思考で行こう!

Life will find a way, we'll find a way Technology lives.

2017年06月

アップルが発表したばかりのHomePodや、アマゾンのEchoやグーグルのHomeというマイク付きのスピーカーが、米国で大きな話題になっています。スマートスピーカーと呼ばれるこれらの製品は、クラウド上のそれぞれの「音声アシスタント」と呼ばれるAIとつながっています。「AI搭載スピーカー」などと呼ばれることもあるようですが、スマートスピーカーは人間の音声を音声アシスタントに送り、音声アシスタントからの応答の音声を再生しているだけです。

音声アシスタントは、ポスト・スマホの新たなプラットフォームになると目されています。パソコンの時代でもスマートフォンの時代でもそうであったように、AIの時代にもプラットフォームを押さえたものが、新しいエコシステムの利権を握ることになるでしょう。その前哨戦が、スマートスピーカーで始まっています。

アマゾン

スマートスピーカーで先行するアマゾンから見てみましょう。スマートスピーカーは、2015年に170万台、2016年に650万台が出荷され、米国のインターネットに繋がった家庭の8%にスマートスピーカーがあり、その9割はアマゾンのEchoシリーズだそうです。 

amazon

アマゾンの音声アシスタントAlexaは、スマートスピーカーから送られてきたユーザーの音声をAIによって認識し、例えば「ピザを注文して」とか「明日の天気は?」といった命令や質問を理解し、あらかじめ決められた形式(Intent)に変換して対象のサービスに送ります。その命令や質問を処理したサービスは、テキストなどの形式の応答をAlexaに返します(図のAPIの部分)。AlexaとAPI(Alexa Skills Kit)で連携する他社のサービスはAlexa Skills(スキル)と呼ばれ、その数はすでに1万2000を超えています。家の中の照明を点けたり、車の中からガレージを開けたりするなど、音声でIoTをコントロールすることもできるようになります。
AVSASK
アマゾンは、自社のスマートスピーカー(Echoシリーズ)だけからではなく、ユーザーが他社の製品からもAlexaに音声でリクエストを送れるようにするための、SDKと呼ばれる開発環境(Alexa Voice Service)を無償で提供しています。すでにフォードとフォルクスワーゲンが、運転中にアマゾンのAlexaと会話できるようにすることを計画しています。

また、iPhoneやAndroidのスマートフォン向けに、(紛らわしいですが)Alexaというアプリを提供しています。スマートスピーカーがなくても、スマートフォンでAlexaと会話することができます。

グーグル

グーグルもアマゾンと同様にSDKとAPIを無償で公開して、ユーザーが音声アシスタントGoogle Assistantと会話するための他社のデバイスを増やし、利用できる他社のサービスを増やすオープン戦略を採っています。アマゾンもグーグルも、スマートスピーカーなどの製品で利益を上げることは考えていないでしょう。自社のプラットフォームのユーザーを増やして活性化させ、それぞれの本業のEコマースや広告からの収益を拡大できれば良いのですから。
google
グーグルのアマゾンとの違いは、図で赤線で示したように、Android OSからGoogle Assistantを呼び出すことができることです。Androidスマートフォンのホームボタンを長押しするか、「オッケー、グーグル」と呼びかけることによって、これまではGoogle Nowの検索画面が表示されていましたが、まもなくGoogle Assistantとチャット(会話)する画面が表示されるようになります。iPhone向けにもAlexa(アプリ)のように、Google Assistantがアプリとして提供されていますが、使い勝手はAndroidスマートフォンに大きく劣ります。

いずれも、音声での会話がデフォルトですが、キーボードを表示させてテキストで会話することもできます。その場合は、答えも音声ではなくテキストで表示されます。また、グーグルのチャットアプリAlloの中でも、チャットボットとしてのAndroid Assistantとテキストで会話することができます。
ai

アップル

さて、Appleはどうでしょうか。HomePodが発売されていない現在の状況で同様の図を描いてみると、ご覧のようにスカスカです。
apple
アップルは一年前にSiriのAPIを公開しました。しかし、それはiOS上のアプリが、Siriと連携するためのものです。
Siriの実体はクラウドのコンピュータで稼働する音声認識と自然言語処理を行うソフトウェアだ。ユーザーの音声による指示を認識して、その内容を理解し、iPhoneにインストールされているアプリの中から、該当するものを探して指示の内容を伝える。「Hey, Siri. 何ができるの?」と聞くと、対応するアプリのアイコンと、どのように話しかければ良いかの例が表示される。

Siriで指示を与えることができるアプリは、アップル製のもの以外ではFacebookとTwitterだけだったが、最新のiOS10で、SiriKitという開発者がSiriを利用するための環境が提供された。「VoIP電話」「メッセージ」「写真」「Apple Pay」「ワークアウト」「乗車券の予約」「CarPlay」「レストランの予約」という8つのカテゴリの、対応する3rdパーティーのアプリにSiriで指示することができるようになる。

カテゴリーごとにSiriで指示できる機能が決められていて、例えば「メッセージ」では「メッセージを送る」「メッセージを探す」「メッセージの属性を設定する」の3つの機能があり、それぞれに必要なパラメータが規定されている。それを満たすためにSiriは、例に示したような形式に従って指示することをユーザーに求める。現時点では、Siriがユーザーを理解してくれるのではなく、ユーザーがSiriを理解して使いこなす必要がある。

アップルはグーグルのAI攻勢にどう対抗するのか?
(2016年10月 Wedge Infinity)
家電をコントロールするためのHomeKitや、運転中にiPhoneを使用するためのCarPlayでも、Siriからアプリを呼び出すことができますが、それらもiPhone(iOS)上での連携になります。また、アップルのチャットアプリiMessengeには、チャットボットはありません。

HomePodを描き入れてみても、あまり代わり映えしませんね。
apple2
HomePodにはiPhoneのようなアプリはありませんから、SiriができることはiPhoneよりもさらに少なくなります。他社のサービスが、クラウドでSiriと連携するためのAPIもまだ公開されていません。年末の発売までに、他社サービスとの連携が行われるのでしょうか。

スマートスピーカーの米国での現在の販売価格は、アマゾンのEchoが179.99ドル、その廉価版のEcho Dotは39.99ドル、グーグルのHomeは109ドルと値下げが続いています。アップルのHomePodは349ドルで発売される計画です。

アップルがSDKを公開して、ユーザーが他社の製品を使ってSiriと会話することを許すことはないと思います。アップルは、徹底してクローズド戦略を採ってきました。それは、提供する製品やサービスのユーザー体験をコントロールするためだと言われてきました。しかし、ちょっと高音質で、音声で操作できるApple Music専用のスピーカーが、新たらしいユーザー体験を生み出す「ホームミュージックの再発明(ティム・クックCEO)」なのでしょうか。

クラウドの音声アシスタントに接続するデバイスが増え、利用できるサービスが増えると、スマートフォンの価値がクラウドに奪われてしまいます。高機能(高価)なスマートフォンでなくても、マイクとスピーカーを備えてインターネットにつながっている様々なものからサービスを利用できるようになります。いまのアップルには、自らそのような、iPhoneの価値を破壊することはできないというジレンマがあるのではないでしょうか。

ご相談やお問い合わせは、contact に @ と ibornb.red をつけたアドレスまでメールでお寄せください。 

記事の更新はTwitter (@kyosukek)でお知らせします。

このエントリーをはてなブックマークに追加

アップルが発表したばかりのHomePodや、アマゾンのEchoやグーグルのHomeというマイク付きのスピーカーが、米国で大きな話題になっています。音声データを分析する米国のベンチャー企業、ボイスラボ(VoiceLabs)の調査レポートは、スマートスピーカーと呼ばれるそれらの製品は、2015年に170万台、2016年に650万台が出荷され、今年は2450万台が販売されるだろうと予想しています。また、コムスコア(comScore)が3月に公開した調査資料によると、米国のインターネットに繋がった家庭の8%にスマートスピーカーがあり、その9割はアマゾンのEchoシリーズだそうです。

ラインやマイクロソフトも同様の製品の発売を計画しています。このように、各社がこぞってスマートスピーカーを発売するのはなぜでしょうか。

ポスト・スマホのAIプラットフォームの覇者は誰か? →(Wedge Infinity)
  1. ポスト・スマホのプラットフォームの前哨戦
  2. スマートスピーカーの現状
  3. 本命はパーソナル・アシスタント
  4. 勝者は誰か?

記事の更新はTwitter (@kyosukek)でお知らせします。


このエントリーをはてなブックマークに追加

人間はコンピュータを持たずに雲の中の音声アシスタントと会話し、その命令や質問に従って、音声アシスタントはインターネットに繋がった様々な機器(IoT)から情報を収集したり、それらに指示を与えたりする。すべてのものにコンピュータやAIが組み込まれて、コンピュータという形は見えなくなる。

ゲームをしたり写真を撮ったりといった用途や、ユーザーの質問に応えて地図などの画像や映像を表示するために、ディスプレイやカメラなどの周辺機器を備えたスマホという形のコンピュータが不要になることはないと思うかもしれません。しかし、それは「スマホありき」という固定概念です。InstagramやLINEなどのように「スマホありき」で誕生した新しいサービスだけでなく、Facebookなどのパソコン向けに開発された多くのサービスも、現在はスマホに最適化(モバイルファースト)されているのです。発想を変えて、「音声アシスタントとの自然な会話」という新しいコンピューティングを前提とした、これまでにないサービスの可能性に目を向けるべきでしょう。

コンピュータが消える日 →(Wedge Infinity)


記事の更新はTwitter (@kyosukek)でお知らせします。

このページのトップヘ