他们无法辨别文字转WAV音频