显然自己的计算方式是错误的文字转WAV音频