BYO STTとTTS を利用する(要開発)
BYOは”Bring Your Own”の意味で、お客さまが準備した物やサービスを指します。ここではBYO STTとTTSを利用する方法をご紹介します。
TTS を利用する場合は弊社側の設定が必要です。カスタマーサクセスまでご連絡ください。
アクションを利用するためには、タイムスタンプ(ブックマーク)と呼ばれる仕様が必要です。リップシンクのみであればタイムスタンプは不要です。
BYO STT(Speech to Text)
BYO STTを実装するには、Webブラウザ上で任意のサービスとのSTTを実装し、音声から変換されたテキストをデジタルヒューマンプラットフォーム(ここではUneeQ)に連携します。
ホステッドエクスペリエンスの場合
uneeqAsk()
を使用します。引数としてSTTで取得したテキストを指定します。
BYOエクスペリエンス(uneeq-js)の場合
sendTranscript()
を使用します。引数としてSTTで取得したテキストを指定します。
BYO TTS(Text to Speech)
ByoTTSを行うには、UneeQ側でNLP(チャットボットエンジン)サービスを使用して特定した返答テキストを音声合成(TTS)する際に呼び出せる、ByoTTSを行うWeb APIを実装します。 ByoTTSを使用する際には、Web APIのエンドポイントURL等をUneeQ側で設定を行う必要があります。カスタマーサクセスにお問い合わせください。
ByoSTT APIへのリクエスト内容
メソッド POST
リクエストヘッダ
項目 | 値 |
Content-Type | application/json |
リクエストボディ
下記の項目と値を含むJSONデータがセットされます。
項目 | 値 |
text | 返答テキスト(音声合成するテキスト) |
apikey | ペルソナ毎に指定できる任意の値 |
- apikeyとしてセットしたい値は、カスタマーサクセスにご指定ください。
リクエストボディ(例)
{
"text": "こんにちは",
"apikey": "任意の値"
}
ByoSTT APIからUneeQへのレスポンス内容
レスポンスヘッダ
項目 | 値 |
Content-Type | application/octet-stream |
レスポンスボディ
UneeQへのレスポンスボディは、下記のフォーマットの音声バイナリデータです。
項目 | 値 |
フォーマット | raw |
チャンネル数 | 1 |
ビットレート | 16bit |
サンプリングレート | 16000Hz |
エンコーディング | signed-integer |
エンディアン | little |
お役に立ちましたか?
😞
😐
🤩
最終更新日 June 17, 2024