从而拉低了平均数文字转WAV音频