第三个完成了全部三个动作的人文字转WAV音频