最终他们还是选择了这个办法文字转WAV音频