根本无从推断对方的身份文字转WAV音频