利用できる言語と音声認識・音声合成

多言語対応

デジタルヒューマンのプラットフォームで標準的に利用できる言語は下記の通りです。拡張すると対応可能言語が利用可能です。

🗣
システムとしては、標準的に以下の機能に対応していますが、拡張すると対応可能言語が利用可能です。ご利用になる音声認識(STT)や音声合成(TTS)の多言語対応状況、バックエンドの会話AI(NLP・LLM)の多言語対応状況によって利用できるかどうかが変わります。
1
English (Australia)
英語(オーストラリア)
2
English (India)
英語(インド)
3
English (New Zealand)
英語(ニュージーランド)
4
English (Singapore)
英語(シンガポール)
5
English (United Kingdom)
英語(英国)
6
English (United States)
英語(アメリカ)
7
Arabic (Algeria)
アラビア語(アルジェリア)
8
Arabic (Egypt)
アラビア語(エジプト)
9
Bengali (India)
ベンガル語(インド)
10
Chinese Mandarin (China)
中国のマンダリン(中国)
11
Danish (Denmark)
デンマーク語(デンマーク)
12
Dutch (Belgium)
オランダ語(ベルギー)
13
Dutch (Netherlands)
オランダ(オランダ)
14
French (Canada)
フランス語(カナダ)
15
French (France)
フランス語(フランス)
16
German (Germany)
ドイツ語(ドイツ)
17
Hindi (India)
ヒンディー語(インド)
18
Italian (Italy)
イタリア語(イタリア)
19
Korean (South Korea)
韓国(韓国)
20
Japanese (Japan)
日本(日本)
21
Portuguese (Brazil)
ポルトガル語(ブラジル)
22
Portuguese (Portugal)
ポルトガル語(ポルトガル)
23
Russian (Russia)
ロシア語(ロシア)
24
Spanish (Spain)
スペイン語(スペイン)
25
Spanish (United States)
スペイン語(米国)
26
Turkish (Turkey)
トルコ(トルコ)
 

使用出来る音声認識、音声合成

日本語向け拡張として、以下のサードパーティー音声認識と音声合成との接続実績があります。その他のサービスでもAPIが公開されている場合、ほとんどの場合で接続が可能です。

Gen3デジタルヒューマンのSynAnimを使用する場合、現時点では音声合成はMicrosoft Azure / Text to SpeechAmazon Web Services / Amazon PollyNTTテクノクロス / FutureVoice Crayonにのみ対応しています。他の音声合成を使用する場合、発話させることは可能ですがアクションやカメラ制御は使用できません。

音声認識(音声文字変換)

プラットフォーム標準
Google Cloud Speech-to-Text (標準)
オプション・接続実績あり
Microsoft Azure Speech-to-Text AmiVoice API NTTドコモ AIエージェントAPI 音声認識 NTTレゾナント AISuite 音声認識 OpenAI Speech to text

音声合成(文字音声変換)

プラットフォーム標準
Microsoft Azure / Text to Speech (SynAnim対応・フリートライアル標準) Amazon Web Services / Amazon Polly (SynAnim対応) Google Cloud Platform / Text-to-Speech ElevenLabs
オプション・接続実績あり
NAVER Cloud Platform / CLOVA Voice IBM Watson / Text to Speech CoeFontAITalk® WebAPI VoiceText Web API ReadSpeaker NTT FutureVoice Crayon (SynAnim対応)
 
お役に立ちましたか?
😞
😐
🤩

最終更新日 May 23, 2023