而是采用抽成的方式来盘剥的文字转WAV音频