然后从他们嘴里得到事情的具体资料文字转WAV音频