diff --git a/README.md b/README.md index 168397a..1a4713b 100644 --- a/README.md +++ b/README.md @@ -77,10 +77,10 @@ widgets: ## 使用方式和范围 使用方式: -* 直接推理,输入为以测试标签为键以待合成文本为值的Dict对象,默认使用voices文件夹下voices.json中第一个发音人 +* 直接输入文本进行推理 使用范围: -* 适用于英式英文的语音合成场景,输入文本使用utf-8编码,整体长度建议不超过30字 +* 适用于中文或中英文混合的语音合成场景,输入文本使用utf-8编码,整体长度建议不超过30字 目标场景: * 各种语音合成任务,比如配音,虚拟主播,数字人等 @@ -105,7 +105,7 @@ write('output.wav', 16000, pcm) ``` ### 模型局限性以及可能的偏差 -* 该发音人支持中文及英文混合,TN规则为中文 +* 该发音人支持中文及中英文混合,TN规则为中文 * 目前支持发音人zhitian_emo,zhiyan_emo,zhizhe_emo,zhibei_emo ### 模型局限性以及可能的偏差 @@ -127,7 +127,10 @@ write('output.wav', 16000, pcm) | MOS | angry | fear | happy | hate | neural | sad | surprise | average| |:------------:|:---------:|:---------:|:------:|:------:|:-----:|:-------:|:-------:|:-------:| | recording | 4.684 | 4.616 | 4.66 | 4.664 | 4.502 | 4.644 | 4.662 | 4.633143 | -| ours | 4.596 | 4.669 | 4.556 | 4.611 | 4.46 | 4.676 | 4.575 | 4.591857 | +| zhitian_emo | 4.596 | 4.669 | 4.556 | 4.611 | 4.46 | 4.676 | 4.575 | 4.591857 | +| zhizhe_emo | 4.366 | 4.612 | 4.381 | 4.618 | 4.52 | 4.542 | 4.617 | 4.5222 | +| zhibei_emo | 4.613 | 4.657 | 4.538 | 4.609 | 4.48 | 4.627 | 4.582 | 4.5866 | +| zhiyan_emo | 4.601 | 4.658 | 4.549 | 4.614 | 4.466 | 4.691 | 4.542 | 4.5887 | ## 引用