但是他们有自己的是非分辨能力文字转WAV音频