但看两个人眼神以及动作文字转WAV音频