TA的每日心情 | 奋斗 昨天 10:48 |
---|
签到天数: 1563 天 连续签到: 4 天 [LV.Master]伴坛终老
|
VALL-E X 可以通过仅使用未曾见过的说话者的 3 秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语 / 跨语言文本到语音功能。) F, r6 j5 y: O( g
/ {9 b3 b$ L: [9 m6 R
使用教程8 W: y6 S3 e/ }7 S, ~' D+ M# w
( G, m1 q- W6 U/ l% L* U; U% h
1.上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。8 D* d& ?4 W t& L A7 W1 i
6 t! ^! }% I# D* i2 q$ e! }
2.模型将用您的音频提示相同的声音合成给定文本的语音。, X3 k9 T6 W. Y" A8 Q6 @$ K
8 W* z" I" \8 ^! s8 A: W3.该模型还倾向于保留您给定语音的情感和声学环境。
7 W$ [0 T% S8 N* h# w
7 Z! D- _6 I* u0 ?% q
( p3 c6 l1 O, y+ A& A
% {- j* {: R5 B8 L4 X0 B7 p0 Z9 ^ e4 Q6 y6 N; r4 N5 q7 @% u2 j
! D Q7 l+ `' j- S
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即加入
x
|