甚至在互相不能读懂的情况下文字转WAV音频