那么基本上就可以判断的出来整个事件的原貌了文字转WAV音频