貌似根据刚才对方的反应文字转WAV音频