任何的言语都是多余文字转WAV音频