首要做的就是学习他们的语言文字转WAV音频