而是一种类似于空间锁定的感知文字转WAV音频