最终接受了这个条件文字转WAV音频