他们完全可以判断得出文字转WAV音频