于是当每一个分身进入不同的区域之后文字转WAV音频