然后三个人异口同声文字转WAV音频