AVS(アレクサボイスサービス)を解説!

Amazon アレクサボイスサービス(AVS)とは、Amazonが提供するクラウドベースの音声サービス。

アレクサデバイスに搭載されている音声アシスタント機能を提供するために使用されるシステムで、音声認識や自然言語理解、さらには音声合成などの機能を提供しており、開発者はこれらの機能を利用して、自分のデバイスやアプリケーションにアレクサの機能を組み込むことができる。

下記に、機能を説明。

・音声認識機能。
・自然言語理解。
・応答生成機能。
・スキル管理機能。


個々の詳細を、下記に記載。

音声認識機能

音声認識機能とは、AVS(アレクサボイスサービス)は、Amazonが提供するクラウドベースの音声認識サービス。

AVSを使用することで、アレクサの音声認識機能を他の製品やサービスに組み込むことができる機能の一つ。

AVSの音声認識機能は自然言語処理技術に基づき、ユーザーが発話した音声をマイクロフォンで受け取り、音声認識エンジンがその音声を文字列に変換しテキストを理解して、ユーザーの意図を理解するために自然言語理解エンジンが使用されるもの。

AVSの音声認識機能は高い精度を誇り、世界中の多様なアクセントや方言を理解することができて自然な発話にも対応。

また、アレクサはユーザーが話しかける言語を自動的に判別することができ、別の言語で話しかける必要もないため、非常に使い勝手てが良いと評判の機能。しかも、Amazon Echoシリーズの製品に搭載されている音声認識機能と同じ技術を使用しており、高い精度を誇り多くの言語に対応しているのも特徴的。

また、AVSは、開発者がAlexaの音声認識機能を自分たちの製品やサービスに組み込むことができるため、Alexaを利用した新しい製品やサービスを開発することができる。

自然言語理解

AVS(アレクサボイスサービス)の自然言語理解機能は、ユーザーが話しかけた言葉を解釈してその意図や要求を理解するために使用される機能。

自然言語理解は機械学習や自然言語処理の技術を用いて実現され、ユーザーが話しかけた言葉は音声認識エンジンによってテキストに変換され、そのテキストが自然言語理解エンジンによって解釈される。

つまり、ユーザーの発話に含まれる単語や文法、発話の文脈などを解析し、その発話の意図や要求を理解する機能という特徴を持つ。

Amazonが独自に開発したalexa skill kit(アレクサ スキル キット)と呼ばれる開発キットを使用しており、アレクサ スキル キットは、開発者がAlexaにカスタムスキルを作成するためのツールセットであり、自然言語理解エンジンの設定やトレーニング、スキルの動作に関するプログラミングなどを行うことができる。

さらにAlexaがユーザーの発話を正確に理解し、適切な応答を返すために非常に重要な役割を果たすという高い精度を誇り、多様な言語や方言やアクセントに対応しているため、世界中で利用されている人気の機能なのも特徴。

応答生成機能

AVS(アレクサボイスサービス)の応答生成機能は、自然言語理解機能によって解釈されたユーザーの要求に対して、適切な応答を生成するために使用される機能。

応答生成を実行するのに、自然言語処理や機械学習などの技術を用いて実現されるのに応答生成にアレクサ スキル キットと呼ばれる開発キットを使用。

開発者はアレクサ スキル キットを使用して、アレクサに対して特定の要求に応答するためのスキルを開発が可能。また多くの場合、音声合成エンジンによって実現されるのも特徴。

応答生成機能では、多くの場合音声合成エンジンによって実現され、テキストを音声に変換する技術を有す。

ユーザーに対するアレクサの応答は、テキストから音声に変換されアレクサデバイスから出力。そのため自然な音声を生成し、発音やイントネーションなどを考慮してテキストを処理実行。

またAVSの応答生成機能は多言語に対応しており、アレクサが様々な応答を生成できるように設計され、さらに応答のカスタマイズも可能なため、アレクサ スキル キットを使用して独自の応答を生成することができる。

スキル管理機能

AVS(アレクサボイスサービス)のスキル管理機能は、開発者が作成したスキルを管理するための機能。ユーザーの音声入力に対し返答を生成するためのプログラムをもち、アレクサ スキル キットを使用してスキルを作成。

スキル管理機能には、下記のような機能が含まれる。

1、開発者はアレクサ スキル キットを使用しスキルが作成可能。ただしスキルの目的や動作を定義する必要がある。

2、スキルが完成したあとスキルをデプロイして、アレクサボイスサービスに登録する必要がある。スキルのデプロイは、AWS Lambdaなどのクラウドサービスを使用して実現されるもの。

3、スキルがデプロイされたあと、スキルのテストを実行して正しく動作するかどうかを確認する必要がある。

4、スキルが公開された後は、開発者はスキルの監視を行ってエラーの原因や改善点を特定し、更新をしなければならない。ただスキルの監視にはアレクサ スキル キットのデバッグコンソールなどのツールを使用することが可能で容易に更新することが可能。

まとめ

Alexa Voice Service(アレクサ‐ボイスサービス)は、米国のアマゾンドットコム社が開発した音声アシスタント機能で、アレクサを利用するためのAPIしたシステム。

もともとは音声認識サービスをスピーカーに搭載したモデルで、アマゾンエコーで使用されていた機能。いまはAVSといわれるAPIを利用し、開発者は自社のサービスにAlexaを組み込むことができるようになったAmazon屈指の機能の一つ。

ユーザーが話しかけることによって、天気予報や今日のスケジュール、さらにはニューズやテレビ観戦情報などありとあらゆる情報が得られ、アレクサ‐ボイスサービス使用に慣れると、もはやアレクサ‐ボイスサービスなしでは日常生活に支障をきたすまでになりそうといえるシステムのようにも感じるすぐれものかもしれない。