有序的摆放在一个个训练区域之内文字转WAV音频