并且将自身的一切能力做一个统计整合文字转WAV音频