所以他只能选择比较保守的一个办法文字转WAV音频