BYO STTとTTS を利用する(要開発)

BYOは”Bring Your Own”の意味で、お客さまが準備した物やサービスを指します。ここではBYO STTとTTSを利用する方法をご紹介します。

⚠️
TTS を利用する場合は弊社側の設定が必要です。カスタマーサクセスまでご連絡ください。 アクションを利用するためには、タイムスタンプ(ブックマーク)と呼ばれる仕様が必要です。リップシンクのみであればタイムスタンプは不要です。
 

BYO STT(Speech to Text)

BYO STTを実装するには、Webブラウザ上で任意のサービスとのSTTを実装し、音声から変換されたテキストをデジタルヒューマンプラットフォーム(ここではUneeQ)に連携します。

 
Notion image

ホステッドエクスペリエンスの場合

uneeqAsk()を使用します。引数としてSTTで取得したテキストを指定します。

BYOエクスペリエンス(uneeq-js)の場合

sendTranscript()を使用します。引数としてSTTで取得したテキストを指定します。

BYO TTS(Text to Speech)

ByoTTSを行うには、UneeQ側でNLP(チャットボットエンジン)サービスを使用して特定した返答テキストを音声合成(TTS)する際に呼び出せる、ByoTTSを行うWeb APIを実装します。 ByoTTSを使用する際には、Web APIのエンドポイントURL等をUneeQ側で設定を行う必要があります。カスタマーサクセスにお問い合わせください。

Notion image

ByoSTT APIへのリクエスト内容

メソッド POST

リクエストヘッダ

項目
Content-Type
application/json

リクエストボディ

下記の項目と値を含むJSONデータがセットされます。

項目
text
返答テキスト(音声合成するテキスト)
apikey
ペルソナ毎に指定できる任意の値
  • apikeyとしてセットしたい値は、カスタマーサクセスにご指定ください。

リクエストボディ(例)

{
    "text": "こんにちは",
    "apikey": "任意の値"
}

ByoSTT APIからUneeQへのレスポンス内容

レスポンスヘッダ

項目
Content-Type
application/octet-stream

レスポンスボディ

UneeQへのレスポンスボディは、下記のフォーマットの音声バイナリデータです。

項目
フォーマット
raw
チャンネル数
1
ビットレート
16bit
サンプリングレート
16000Hz
エンコーディング
signed-integer
エンディアン
little
お役に立ちましたか?
😞
😐
🤩

最終更新日 June 17, 2024