这一次不需要比较前后和具体落点文字转WAV音频