音声認識

 

音声をテキストに変換します。

 

顧客が話した単語やフレーズに基づき、通話をルーティングする際に役立ちます。

電話からの音声が、サードパーティのービスプロバイダーによって認識され、テキスト化された音声とそのコンフィデンスレベルとともに配列に割り当てられます。指定した閾値以上のコンフィデンスしきい値のテキストのうち最初の3つの結果が格納されます。これらの結果を、着信電話のルーティングに使用できます。

プロパティ

「音声認識」セクション

「メディア」セクション

「認識結果」セクション

「アドバンスオプション」セクション

「音声認識」セクション

オプション

内容

プロバイダー

使用したいサードパーティの音声認識プロバイダーを選択してください。プロバイダーが一つのみ設定されている場合は、プロバイダーは選択できません。下記のフィールドには設定済みプロバイダーに対して有効なものを設定してください。

言語

検出言語を選択してください。

無音期間

無音の期間を設定します。話し中に無音の期間が検出されると、音声認識が終了します。

タイムアウト

音声認識が終了するまでの継続時間を設定します。

コンフィデンスレベルしきい値 (%)

パーセンテージでしきい値を指定してください。このしきい値以上の認識結果が、認識結果変数(下記を参照)に書き込まれます。

「メディア」セクション

オプション

内容

メディアリストを選択/

動的メディアリストを使用/

メディアリスト/

イントロダクションプロンプト/

メディアアイテムを選択/

動的メディアアイテムを使用/

イントロダクションプロンプト

発信者に読み上げを促すために使用するメディアファイルを選択してください。

「認識結果」セクション

このセクションでは、音声認識サービスプロバイダーから返された認識結果/コンフィデンスレベルの変数ペア(最大3ペア)を保存してください。保存された認識結果に従って電話をその後のアクションセルにルーティングすることができます。

オプション

内容

認識結果/コンフィデンスレベル

「認識結果」フィールドには文字列変数を入力してください。この変数には、コンフィデンスレベルが指定した「コンフィデンスレベルしきい値(%)」プロパティに指定されたもの以上の場合に、スペースを含んで最大2048文字の認識結果が保存されます。 

「コンフィデンスレベル」フィールドには整数型変数を入力してください。この変数には、音声認識サービスプロバイダーから返された認識結果にアサインされたコンフィデンスレベル値が格納されます。「追加」をクリックしてください。

「認識結果」と「コンフィデンスレベル」の変数ペアを最大3つ作成できます。

「アドバンスオプション」セクション

オプション

内容

Single-Utteranceモード

チェックボックスを選択した場合(デフォルト設定)、1つのまとまった言葉が話されたとFLOWが見なすと、音声認識が終了します。

メモ:このオプションが有効になっている場合でも、上記の「無音期間」フィールドと「タイムアウト」フィールドに指定された値は適用されます。発信者が発話中に無音になる場合や、1つの言葉が「タイムアウト」で指定された値を超える場合があるためです。

発話判断をFLOWではなく言葉がいつ話されたかみなされるのではなく、「無音期間」フィールドと「タイムアウト」フィールドのみで音声認識を制御したいする場合は、このチェックボックスを選択しないでください。音声に複数の言葉を含めることができます。

クラストークン

Googleドキュメントにリストされているトークンを参照し、クラストークンを指定します(すべてのクラストークンは、「$」で始まる)。=で始まるリテラル値か、文字列変数にしてください。

クラストークンは、期待される発話やフレーズの音声認識を改善するために使用します。例えば、$Timeクラストークンを使用すると、「よじよんじゅっぷん」と発声した言葉を、「よじよんじゅっぷん」という文字に変換するのではなく、「4:40」として音声文字変換されます。

メモ:クラストークンはサードパーティのアプリケーションによってサポートされるため、希望するテキストへの文字変換は保証されません。

切断時に、文字起こし処理を開始

お客様が電話を切断(してスクリプトの実行が終了)した後で、会話の一部を後で利用するために文字起こしをしたい時に選択してください。例:電話切断後、メインスクリプトの実行が終了したときにクリアダウンハンドラスクリプトを呼び出し、レポートで利用すること。

文字起こしたくない場合は、このチェックボックスを選択しないでください。例:キューへのルーティングなど、ルーティングのみを目的とした場合、このアクションセルの利用は有用とはいえません。お客様が電話を切断した場合、文字起こしをしても、どこにもルーティングできないからです。

遷移点

遷移点

内容

認識結果が得られました

音声認識サービスプロバイダーから、「コンフィデンスレベルしきい値(%)」プロパティの値以上の認識結果が少なくとも1つ返された場合。

認識結果がありません

音声認識サービスプロバイダーから、「コンフィデンスレベルしきい値(%)」プロパティの値以上の認識結果が返されなかった場合。

音声がありません

「タイムアウト」プロパティに設定した時間内に音声を検出できなかった場合。

エラー

内部システムエラーが発生した場合。