就是他在背后主导的文字转WAV音频