而现在他自己能理解文字转WAV音频