毕竟只知道对方的位置和自己的位置文字转WAV音频