TA的每日心情 | 无聊 前天 09:24 |
---|
签到天数: 1222 天 连续签到: 5 天 [LV.10]以坛为家III
|
VALL-E X 可以通过仅使用未曾见过的说话者的 3 秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语 / 跨语言文本到语音功能。) j; T. n* b" K* G8 M1 d- r. t
) h) v! b+ q, d* i5 \- w! R1 y. ]使用教程
0 @' K$ ]: }9 n: t3 _3 J) H5 |. a' |) E$ T( S. n: ?# c$ N0 T
1.上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。- f7 F5 R, w# Y/ N4 }6 r' N$ B
5 ^7 P i+ C5 w! c* i2.模型将用您的音频提示相同的声音合成给定文本的语音。
/ e' T$ T$ E$ M3 y7 W
5 c; H; t, v: E! p. q+ o. {5 r, O B3.该模型还倾向于保留您给定语音的情感和声学环境。
0 d5 S/ B* S5 C6 @/ p2 v2 L0 V1 k1 v
4 ~2 d9 ^0 K7 Z1 I0 c0 K4 k% [- a4 h" q, `; Y
9 ]: L: v/ M, `: N3 k1 l
1 r: W4 z3 d; O3 _( H6 b
- S& t$ h; f R5 u/ F9 M% Z
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即加入
x
|