随后不停的在人群当中找寻文字转WAV音频