在确定了眼前那十几个人短时间内都站不起来之后文字转WAV音频