他认为姚放拿出来的方案是比较合适的文字转WAV音频