并且所有人出来都是一个反应文字转WAV音频