再加上两个人的气质文字转WAV音频