就是让他们两个人自行的去参与文字转WAV音频