TA的每日心情 | 郁闷 4 小时前 |
|---|
签到天数: 1704 天 连续签到: 6 天 [LV.Master]伴坛终老
|
VALL-E X 可以通过仅使用未曾见过的说话者的 3 秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语 / 跨语言文本到语音功能。
/ ?8 K/ M) m2 P; e) ^! k! F) J o. O8 a: R9 }# W3 ^5 Q. v0 B. n
使用教程
1 N4 m/ D# h. Z- L, v$ n& c1 ?' k
; l' u: h, h, z! Y R f1 n! W$ v6 l! Y1.上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。
8 D S7 p0 M4 P1 h$ v" p* ]% `/ ~" v3 ~# R) \- l1 J7 W0 a ?( _
2.模型将用您的音频提示相同的声音合成给定文本的语音。
* Z7 Y4 V9 v* V! o$ B3 J0 p* P4 r6 r+ ]6 S1 H6 L W2 a% A
3.该模型还倾向于保留您给定语音的情感和声学环境。
# a( D; G0 F1 i3 \! {' z$ I v+ s X8 x; A+ [" y) |
# w3 B. Q1 P. v5 a
) ^! Z: T3 @9 ?2 k- j
9 @# e6 M' o/ g+ X4 B
* l4 `& U" S3 ]' J |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即加入
x
|