就是满足一定量的贡献值文字转WAV音频