根据观测到的信息文字转WAV音频