最终的目的是争取两个名额文字转WAV音频