他们听到的都是真的文字转WAV音频