但是我们并不能完全信任他们文字转WAV音频