我已经考虑了距离产生的偏差了文字转WAV音频