就需要消耗更多能量和计算力来维持文字转WAV音频