互相印证之后才能最终确定文字转WAV音频