TA的每日心情 | 奋斗 昨天 12:46 |
|---|
签到天数: 1625 天 连续签到: 5 天 [LV.Master]伴坛终老
|
VALL-E X 可以通过仅使用未曾见过的说话者的 3 秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语 / 跨语言文本到语音功能。2 e; G7 d# ~; {5 N M$ _
# ]$ ?3 U6 i% r- O% ?; ]
使用教程
! ~9 D$ Z% }/ C8 }
9 F1 I/ N, Y5 Q! {- F! x1 n1.上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。# H9 C! y# s+ e, p# }, D6 y* ^6 N
9 x, d6 C7 K1 i$ i( c
2.模型将用您的音频提示相同的声音合成给定文本的语音。
: k1 L# c. n" g5 L& \8 p0 \: Y' y+ L; o# X9 E( T
3.该模型还倾向于保留您给定语音的情感和声学环境。
( O, ^% A4 e2 B% a$ q C. S4 o
1 F6 E' @6 \ E9 S7 D" I* t0 j/ ]/ B4 m; [
5 N4 }5 t( F0 M, j3 W8 A, x! L7 l; \1 `% t9 S' M8 P5 N
' q/ L! r( N/ R: f
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即加入
x
|