但是两个人就是通过眼神相互的交流一下文字转WAV音频