1 Star 7 Fork 4

夜雨飘零 / PPASR

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
generate_audio.md 1.10 KB
一键复制 编辑 原始数据 按行查看 历史
yeyupiaoling 提交于 2023-01-10 16:18 . 更换合成语音文件的框架

合成语音数据

  1. 为了拟补数据集的不足,我们合成一批语音用于训练,语音合成一批音频文件。首先安装PaddleSpeech,执行下面命令即可安装完成。
python -m pip install paddlespeech
  1. 然后下载一个语料,如果开发者有其他更好的语料也可以替换。然后解压dgk_lost_conv/results目录下的压缩文件,windows用户可以手动解压。
cd tools/generate_audio
git clone https://github.com/aceimnorstuvwxz/dgk_lost_conv.git
cd dgk_lost_conv/results
unzip dgk_shooter_z.conv.zip
unzip xiaohuangji50w_fenciA.conv.zip
unzip xiaohuangji50w_nofenci.conv.zip
  1. 接着执行下面命令生成中文语料数据集,生成的中文语料存放在tools/generate_audio/corpus.txt
cd tools/generate_audio/
python generate_corpus.py
  1. 最后执行以下命令即可自动合成语音,合成时会随机获取说话人进行合成语音,合成的语音会放在dataset/audio/generate, 标注文件会放在dataset/annotation/generate.txt
cd tools/generate_audio/
python generate_audio.py
Python
1
https://gitee.com/yeyupiaoling/PPASR.git
git@gitee.com:yeyupiaoling/PPASR.git
yeyupiaoling
PPASR
PPASR
release/2.4.x

搜索帮助