TA的每日心情 | 郁闷 昨天 08:34 |
---|
签到天数: 1496 天 连续签到: 5 天 [LV.10]以坛为家III
|
VALL-E X 可以通过仅使用未曾见过的说话者的 3 秒录音作为声学提示,合成高质量的个性化语音,即使是对于一位母语讲者,也可以在另一种语言中执行。此实现支持三种语言(英语、中文、日语)的零尝试、单语 / 跨语言文本到语音功能。! v! g/ h4 P# S0 O% d5 P- E' s/ T
g( ]5 J# e- j$ Y6 b- C使用教程
G5 K& \* Y3 n( Q6 R
1 J' x6 h- o( \1 `' i! ~' k0 O& g4 X1.上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。
, y# s* o. p8 y D$ D% w0 g. v2 j1 Q+ Z8 l+ Y! i# M+ m! k
2.模型将用您的音频提示相同的声音合成给定文本的语音。9 r8 m8 }$ [( }2 K/ h
1 w6 A, k1 b6 H0 A3.该模型还倾向于保留您给定语音的情感和声学环境。
C5 l* B- {* X6 m% x- C9 V4 g$ M% O, T& n' E
: K* A0 m- }* ]" ?6 j9 |4 Z# [- e
. Q% X& h `$ d: g. T) a1 s' l$ Y: Q) L% F' v8 K" M
6 T, x' Z! R I" m4 _$ T8 q5 n |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即加入
x
|