但是该掌握的基础并没有掌握文字转WAV音频