所以只能是轮到他第一个走出来文字转WAV音频