这里面有一个动力源是活生生的文字转WAV音频