googleアシスタントの現在の性能を認識せよ!

Screenshot of ai.googleblog.com

 

5月に発表されたgoogle duplex の性能を御存知ですか?紹介動画を見てみましょう。

街を歩いている女性が、夫からメールを受け取ります。「ベビーシッターが予約出来たから、ディナーの予約してくれる?」という内容です。それで、女性は
グーグルアシスタントに話し掛けます。

「ヘイグーグル!火曜日の7時にエルカカテロレストラン2名で席あるかしら?」、グーグルアシスタントは自然な発音で返答します。
「ちょうどその時間は埋まってるんです。7時から8時の間であいてるかどうか聞いてみますが良いですか?」
「お願い」
「それではあなたの名前と電話番号で予約しておきます。そして15分以内に結果をお知らせします。良いですか?」
「完璧よ!ありがとう!」、それで、グーグルアシスタントは、今度は、お店に電話するんですね。

「エルココテロです!いらっしゃいませ!」
「こんにちは!私はグーグルアシスタントです、お客様の為に予約するために電話しました。この自動電話は録音されています。12日火曜日に予約できますか?」
「いいですよ。何人ですか?」
「2名です、火曜日。」
「確認しますので、ちょっと待って下さい。」
「ええ」
「7時はあいてないんですけど、8時はどうですか?」
「はい、8時で大丈夫です。」
「完璧!それでは、お名前を伺えますか?」
「ファーストネームはアンナ。」
「オーケー、では火曜日にお待ちしています。」
「恐れ入ります。ありがとう!」と、予約電話が完了してしまいます。

それで、スマホの待ち受け画面に、「あなたの予約は完了しました。エルカカテロレストラン、7月12日火曜日8時、2名」と表示されるんですね!

言っておきますけど、この動画はドキュメンタリー動画ではなく、プロモーション動画ですからね!だから出ているのも役者さんで、まあ、台本に従ってしゃべっているんだと思われますし、多少の演出が入ってるのかもしれません。このサービスが現在、ビジネスベースで提供されているかどうかも分かりません。まだ、実用レベルに達するまでには少々手直しが必要かもしれません。しかし、実験レベルでは成功しているということなんですね。このようなスムーズな受け答えが!

つまり、音声認識も、音声合成も、意味理解も「そこらへんの普通の中高生ぐらいの知能であれば、現実に成立しているのではないか?」ということになります。これを踏まえて、中高生、大学生には、自分の進路を考えて頂きたいですね。