mirror of
https://www.modelscope.cn/iic/speech_sambert-hifigan_tts_zh-cn_16k.git
synced 2026-04-02 18:32:53 +08:00
fix readme
This commit is contained in:
11
README.md
11
README.md
@ -77,10 +77,10 @@ widgets:
|
||||
## 使用方式和范围
|
||||
|
||||
使用方式:
|
||||
* 直接推理,输入为以测试标签为键以待合成文本为值的Dict对象,默认使用voices文件夹下voices.json中第一个发音人
|
||||
* 直接输入文本进行推理
|
||||
|
||||
使用范围:
|
||||
* 适用于英式英文的语音合成场景,输入文本使用utf-8编码,整体长度建议不超过30字
|
||||
* 适用于中文或中英文混合的语音合成场景,输入文本使用utf-8编码,整体长度建议不超过30字
|
||||
|
||||
目标场景:
|
||||
* 各种语音合成任务,比如配音,虚拟主播,数字人等
|
||||
@ -105,7 +105,7 @@ write('output.wav', 16000, pcm)
|
||||
```
|
||||
|
||||
### 模型局限性以及可能的偏差
|
||||
* 该发音人支持中文及英文混合,TN规则为中文
|
||||
* 该发音人支持中文及中英文混合,TN规则为中文
|
||||
* 目前支持发音人zhitian_emo,zhiyan_emo,zhizhe_emo,zhibei_emo
|
||||
|
||||
### 模型局限性以及可能的偏差
|
||||
@ -127,7 +127,10 @@ write('output.wav', 16000, pcm)
|
||||
| MOS | angry | fear | happy | hate | neural | sad | surprise | average|
|
||||
|:------------:|:---------:|:---------:|:------:|:------:|:-----:|:-------:|:-------:|:-------:|
|
||||
| recording | 4.684 | 4.616 | 4.66 | 4.664 | 4.502 | 4.644 | 4.662 | 4.633143 |
|
||||
| ours | 4.596 | 4.669 | 4.556 | 4.611 | 4.46 | 4.676 | 4.575 | 4.591857 |
|
||||
| zhitian_emo | 4.596 | 4.669 | 4.556 | 4.611 | 4.46 | 4.676 | 4.575 | 4.591857 |
|
||||
| zhizhe_emo | 4.366 | 4.612 | 4.381 | 4.618 | 4.52 | 4.542 | 4.617 | 4.5222 |
|
||||
| zhibei_emo | 4.613 | 4.657 | 4.538 | 4.609 | 4.48 | 4.627 | 4.582 | 4.5866 |
|
||||
| zhiyan_emo | 4.601 | 4.658 | 4.549 | 4.614 | 4.466 | 4.691 | 4.542 | 4.5887 |
|
||||
|
||||
|
||||
## 引用
|
||||
|
||||
Reference in New Issue
Block a user