涉及到了定位的问题文字转WAV音频