虽然他的反应几乎是同时的文字转WAV音频