精确计算每一个位置文字转WAV音频