根据外面的目击者描述文字转WAV音频