他可以清楚的分辨出文字转WAV音频