用一两百人就控制了建筑群文字转WAV音频