水准也是从一开始就维持在一个相当高的水准上文字转WAV音频