而且其他感知也被一定程度干扰的同时文字转WAV音频