最后还是要输入到外围的六个人的身上文字转WAV音频