他们两个之间的对话就是当着大家的面说的文字转WAV音频