经过三番四次的检测文字转WAV音频