分别在他们身边的不同的方位站着文字转WAV音频