TA的每日心情 | 开心 8 小时前 |
---|
签到天数: 1595 天 连续签到: 1 天 [LV.Master]伴坛终老
|
VALL-E X 可以通过仅使用未曾见过的说话者的 3 秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语 / 跨语言文本到语音功能。% |. l4 e/ E( @; u3 o8 K
1 t2 c( P. h# B8 c/ {& _ z使用教程, S( R! H. g. @" m9 @+ [4 R/ u
4 p: z7 o4 E6 E7 n2 s1.上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。; p1 X* u1 M, w. x% p5 R, o: f1 n
0 c& Z+ P- @# C) g3 N
2.模型将用您的音频提示相同的声音合成给定文本的语音。$ X; S2 Y( X P+ R( l
/ s- a( [9 ~* T2 T; G" e3.该模型还倾向于保留您给定语音的情感和声学环境。. h4 a- y9 H% B9 I/ v2 l3 P. l6 d* o
$ A( B& U" }, a! U
- f7 K% ]& U4 a- ?) Z# F3 C% f3 s. [' A3 }* e4 Y
! Z% `1 U7 l! |& |* r4 E+ ^
0 V# [6 g& |# a' R, O9 u" W |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即加入
x
|