这其实就是所处的位置不同文字转WAV音频