文章目录[隐藏]
参考博客:
运行中文例子
kaldi编译配置
资料:http://www.kaldi-asr.org/doc/ Kaldi官方文档
https://shiweipku.gitbooks.io/chinese-doc-of-kaldi/content/ Kaldi中文手册,翻译自Kaldi官方文档
一、安装配置Kaldi
二、下载语音数据
#
The database can be downloaded from openslr:
http://www.openslr.org/18/
or from the CSLT server:
http://data.cslt.org/thchs30/README.html
下载完之后,在kaldi/egs/thchs30/下建立目录thchs30-openslr(也可以在其他目录中,不一定要在这个目录,名称随意,设置路径要用),解压到此目录下。
三、修改脚本并运行
1、/thchs30/s5/run.sh中,修改:
n=4 #parallel jobs
n=4代表并行任务数,我的电脑cpu核心数为4所以改成4(我的在第8行)
2、第11行,修改路径
thchs=你刚刚解压文件的路径 如: thchs=/home/kaldi/egs/thchs30/thchs30-openslr
3、修改/thchs30/s5/cmd.sh为(具体可以参照这个文件中的说明):
export train_cmd=run.pl export decode_cmd=run.pl export mkgraph_cmd=run.pl export cuda_cmd=run.pl
4、运行
cd到s5目录下,运行 ./run.sh。


