每一次都是说一个目标的距离文字转WAV音频