确定他们的具体位置后文字转WAV音频