TTS

 

音声合成発信者に、テキストを合成音声で読み上げます。

 

[メディアを再生]アクションセルと一緒に使用すると、一般的なテキストと変数に格納されたユーザー固有の情報を組み合わせた音声メッセージを作成できます。例:

メディアを再生(Dear.wav)

TTS

メディアを再生 (Entered.wav)

TTS

「Dear」

「John」

「You have just entered」

「one, six, one, zero, nine」

言語オプションはライセンスを取得後に使用可能になります。

Googleがサポートしている言語および音声コードのリストは、次のリンクを参照してください:

https://cloud.google.com/text-to-speech/docs/voices

Microsoft Azureがサポートしている言語および音声コードのリストは、次のリンクを参照してください:

https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/language-support?tabs=tts

プロパティ

「TTS」セクション

「オプション」セクション

「アドバンスオプション」セクション

「TTS」セクション

オプション

内容

モデル

使用する音声合成モデルを選択してください。「brain TTS」オプションは、AIで強化した機能をいくつかのプロバイダーから提供します。

このリストには、カスタムモデルや、サードパーティが提供する個別開発したTTS(音声合成)が表示される場合もあります。

「brain TTS」では、音声の速度を変更することができます。詳細は、以下の「アドバンスオプション」セクションを参照してください。

プロバイダー

「brain TTS」の場合にのみ表示されます。

使用したいAIプロバイダーとして、「Google」または「Azure」を選択してください。

再生するテキスト

数値、単語、またはフレーズを、先頭に「=」を付けて記述してください。

または、文字列変数を入力してください:

「オプション」セクション

言語、音声、およびカットスルーオプションを指定できます。

オプション

内容

言語の選択方法/

言語/

音声の選択方法/

音声

「標準」音声合成モデルの場合は、言語を選択してください(アクセスにライセンスが必要です)。

「brain TTS」音声合成モデルの場合、まず「言語を選択」オプションを選択してから、言語を「言語」オプションリストから選択してください(「英語(UK)」など)。次に、「音声を選択」オプションで音声を選択してください(「女性標準A」など)。音声の名前を含む文字列変数を使用したい時は、「動的に音声を使用」を選択してください。

    

「動的に言語を使用」オプションを使用すると、言語と音声の両方に対して変数を使用できます。

変数を使用する場合は、変数に入力する言語名と音声名の値が、AIプロバイダーによって定義された言語コードと音声コードに対応していることを確認してください。サポートされている言語と音声コードのリストについては、参考情報を参照してください。

例として、GoogleとAzureの両方とも、イギリス英語には「en-GB」言語コードを使用しています。Googleでは、イギリス英語の女性標準音声タイプに「en-GB-Standard-A」音声コードが使用されています。Azureでは、「Sonia」音声に「en-GB-SoniaNeural」音声コードが使用されています。

メモ:音声は、AIプロバイダーによって変更される場合があります。

発話

「標準」音声合成モデルの場合は、発話フィールドは、空白のままにするか、あるいは発話した際にテキストまたは変数がレンダリングする方法を示す値を記述してください。サポートされている各データ型別の読み上げを以下の表に示します。スタンダードは日本語に対応していないので、英語で例示します。

読み上げパラメータ

データ型

データの例

読み上げ方

blank

数値/

英数字

1000

「せん」

blank

日付

年:2018

月:2

日:1

「にがつじゅうににち」

blank

アルファベット

John Smith

「じょん・すみす」

数字

数値/

英数字

1000

「One, zero, zero, zero」

spell

アルファベット

John Smith

「J、O、H、N、S、M、I、T、H」

例:

「brain TTS」音声合成モデルの場合は、以下のオプションのいずれかを選択してください。

メモ:一部のプロバイダーには使用できないオプションがあります。

オプション

データの例

読み上げ方

テキスト

1000

「せん」

アドレス

150th CT NE, Redmond, WA

「150th Court Northeast Redmond Washington」

基数

12345

「いちまんにせんさんびゃくよんじゅうご」

序数

1

「最初」

文字

can

「C、A、N」

分数

5+1/2

「ごとにぶんのいち」

単位

10 feet

「じゅうふぃーと」

日付

1970/09/10

「せんきゅうひゃくななじゅうねんくがつとおか」

テーブルの脚注を参照してください。

10/9

「きゅうぶんのじゅう」

テーブルの脚注を参照してください。

10/9/1970

「せんきゅうひゃくななじゅうねん、くがつとおか」

テーブルの脚注を参照してください。

時間

2:30pm

「じゅうよじさんじゅっぷん」

電話番号

090-1234-5678

「0,9,0の1,2,3,4の5,6,7,8」

名前

フレッド

「ふれっど」

数字

1000

「One, zero, zero, zero」

*これは一例であり、選択した言語に関連付けられているロケールの文化的基準によって異なる場合があります。

カットスルーを有効化

これを選択すると、発信者は音声の再生の終了前に再生を停止するキーを押せるようになります。有効化するときはチェックボックスにチェックをいれてください。その上で、対象となる数字を選択してください。

「アドバンスオプション」セクション

「brain TTS」音声合成モデルにのみ表示されます。

オプション

内容

ピッチ

合成された音声のピッチを変更することができます。

声を高くする時は、ピッチのスライダーを右に移動させてください。左に移動させると、声が低く(太い声)なります。

レート

合成された音声の速度を変更することができます。デフォルト値は100%で、人間の通常の速度です。

スライダーを右に移動させると、速くなり、左に移動させると、遅くなります。レートを変更しても音声は歪みません。

遷移点

遷移点

内容

プロンプトの終わり

プロンプトが正常に再生された場合。

エラー

エラーが発生した場合。

終了ディジット

発信者が、「カットスルーを有効化」プロパティで定義されている終了キーを押した場合。