从一开始的目的就是要逼迫托兰文字转WAV音频