概要
Text to Speechツールは、入力したテキストの内容を、音声ファイルとして生成する機能です。
声質や表現パターンも豊富にあり、動画のナレーションや文章の読み上げなどに使用することができます。
Text to Speechツールの使い方
Text to Speechツールは、またはエージェントアプリのツールとして追加することができます。
Text to Speechツールの追加方法
エージェントアプリ作成画面から、「ツールを追加」をクリックするとText to Speechツールを追加できます。


Text to Speechツールの使い方
Text to Speechツールを追加し音声生成を行う際、最初のプロンプトが音声に起こしたいテキストのみ明記されており、「声の種類」「希望のニュアンス」「出力したい拡張子」の指定がない場合、AIから質問が返ってきます。

声の種類(女性)
アケルナル
アオエデ
オウトノエ
カリュローエ
デスピナ
エリノメ
ガクラックス
Kore
ラオメデイア
Leda
プルケリマ
スラファト
ビンデミアトリクス
Zephyr
声の種類(男性)
アキアード
アルゲニブ
アルギエバ
アルニラム
カロン
エンケラドゥス
Fenrir
イアペトゥス
Orus
Puck
ラサルゲティ
サダクビア
サダルタゲル
スケダル
アムブリエル
ズベンエルゲヌビ
声の表現パターン
声の表現やニュアンスのパターンは非常に多く、プロンプト(AIに指示出しした文言)によって細かなニュアンスが変わります。
一例として、以下のようなプロンプトで声のニュアンスを調整することができます。
・「悲しそうに」
・「明るく」
・「怒ったように」
・「楽しそうに」
・「落ち着いた声で」
・「ささやくように」
・「興奮した様子で」
出力可能な拡張子
対応している拡張子は以下の通りです。
mp3、wav、ogg