所以他们最终选择了一个很前卫的方式文字转WAV音频