都是用一种非常凝重的表情盯着对方文字转WAV音频