但是具体的事情都是他们两个在处理文字转WAV音频