我们暂时只知道两个灵的位置文字转WAV音频