虽然没有用视觉确认文字转WAV音频