让他在脱口而出的前两秒文字转WAV音频