概要
高度なアプリ(ワークフローアプリ)で利用できる、「音声をテキストに変換」ノードについてバージョンアップしました。
今回のバージョンアップの詳細は下記の通りです。
| 項目 | 従来 | 今回のリリース | ポイント |
| 使用モデル | Speech-to-Text V1 API | Speech-to-Text V2 API | Google製の最新文字起こしモデルを採用。 |
| クラウドサービス | Google Cloud | Google Cloud | ー |
| 聞き取りの精度 | 標準的なAIによる解析 | 最新の高性能AIを採用 | ざわざわした場所や、複数人の会話もより正確に書き起こせます。 |
| 大量データの処理 | 1つずつ順番に処理 | まとめて一気に処理 | 長い音声ファイルや大量のデータを、効率よくスムーズに変換できます。 |
| 対応言語の賢さ | 一般的な言語対応 | より自然な言葉の理解 | 最新の学習データにより、話し言葉や最新の用語にも強くなりました。 |
使い方
従来通り、ワークフローアプリの作成画面の「音声をテキストに変換」ノードをそのまま利用することができます。
※音声をテキストに変換ノードは、「音声録音ノード」(リアルタイムでの音声の録音 / 音声ファイルのアップロードができるノードです)とセットで使います。
