> For the complete documentation index, see [llms.txt](https://docs.digitalhumans.jp/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.digitalhumans.jp/ops/control/speech-control-ssml.md). # 発話制御：SSMLの利用音声合成マークアップ言語（Speech Synthesis Markup Language / SSML）を利用すると、デジタルヒューマンの声色や発声をより細かく制御することができます。 SSMLはXMLベースのマークアップ言語であり、これにより開発者はデジタルヒューマンのTTS（Text-to-Speech）を使用して、入力テキストを合成音声に変換する方法を指定できます。プレーンテキストと比較して、SSMLでは開発者が音声合成出力のピッチ、読み方、読み上げ速度、音量などを微調整できます。通常の句読点は自動的に処理されますが、ピリオドの後の一時停止や疑問符で終わる文のイントネーションなど、正しい使用法にも対応しています。すべてのTTSプロバイダが全てのSSMLをサポートしているわけではなく、ほとんどのプロバイダはSSML仕様で定義されている一部のタグのみをサポートしています。設定する際にはTTSプロバイダのSSMLガイドラインに従ってください。 ## SSML SSMLは引き続き完全にサポートされています。SynAnimおよびSSMLの使用の最も簡単な例： ```xml Hello! ``` 以下は、AzureのSSMLをそのニューラルボイスの一つと共に使用した、より複雑な例です。複数のuneeq:タグを使用できること、またそれらは"voice"タグ内に配置されるが、"prosody"のように"voice"タグ内に含めることができる他の要素の外側に配置されることに注意してください。 ```xml Hey! It's great to see you. I'm Sophie. I'm here to help out with some recommendations. How can I help today? ``` ### **各社のSSML仕様ページ** | Azure Text to Speech | | SynAnim対応 | | --------------------- | -------------------------------------------------------------------------------------------------------------- | --------- | | Amazon Poly | | SynAnim対応 | | Google Text-to-Speech | | | | NAVER CLOVA Voice | 未対応 | | | Watson Text to Speech | | | | CoeFont | 未対応 | | | AITalk | | | | ReadSpeaker | 一部対応（管理画面ログイン後にドキュメントがあります） | | | FutureVoice Crayon | 付属資料に記載 | SynAnim対応 | SSMLを使用している場合は、タグの中にビヘイビアタグが含まれていることを確認する必要があります。 ```html Good morning! What can I help you with today? ``` タグと、TTSプロバイダがサポートしているSSMLタグと組み合わせることで、デジタルヒューマンの行動や発話に複数の効果を適用することができます。 ### **Google TTSを使用する場合** Google TTSを使用している場合、タグが他のSSMLタグの中に入れ子になっていないことを確認してください。さらに、タグは、タグの後ろに入れることが必要です。 ```html Google TTSを使ったSSMLの正しい使い方 This is how I speak when I’m excited! ~~This is how I speak when I’m happy.~~ ``` ```html Google TTSを使ったSSMLの間違った使い方 ~~This is how I speak when I’m excited!~~ ~~This is how I speak when I’m happy.~~ ``` ### Azure TTSを使用する場合 SynAnimを動かすためにはAzure TTSを利用する必要があります。Azure TTSを利用する婆は下記の様に設定するとSSMLが利用できます。 ```jsx # 発話速度（話速）を半分にして、途中に650msの中断を入れる場合 This is すごいですね！ ``` ```jsx # 発話速度（話速）を10%上げて、カメラを顔にズームする場合いつもデジタルヒューマンコーヒーショップのご利用ありがとうございます。 ``` ```jsx # 話者のStyleを変更する場合 ~~uttrance_str（ここに発話するテキストが入る）~~ ``` ### **その他のTTSプロバイダー** Google TTSを使ったSSMLとは違った使い方が必要な場合があります。 ```html 正しい使い方例1 This is how I speak when I’m excited! This is how I speak when I’m happy ``` ```html 正しい使い方例2 ~~This is how I speak when I’m excited!~~ ~~This is how I speak when I’m happy.~~ ```