我们只能尽量减少规模文字转WAV音频