我把几个坐标点计算了一下文字转WAV音频