TA的每日心情 | 奋斗 3 天前 |
|---|
签到天数: 1682 天 连续签到: 4 天 [LV.Master]伴坛终老
|
VALL-E X 可以通过仅使用未曾见过的说话者的 3 秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语 / 跨语言文本到语音功能。; b- P: {9 X& a# ^
2 q: U" h) ~6 o! H% b! u; M使用教程. ?, I! h9 x g) e( A
9 P6 {% a3 X& d0 O; |- C1.上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。: \' h$ _7 j9 s4 W; `
/ _" O& N" P2 Z) ^0 Y/ |. E
2.模型将用您的音频提示相同的声音合成给定文本的语音。
( r2 W; L1 `0 h
) F2 R' b# m( R8 c3.该模型还倾向于保留您给定语音的情感和声学环境。8 Q: X6 z! A* R! q& j& R
6 C( ~4 C4 V" P8 X- t$ w" v i0 f1 K/ y" H y
i6 ~2 U! N" X7 D
, N D! l! `) G( t
' p7 L# C: k2 T3 V7 s |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即加入
x
|