而是在人群的角落里面文字转WAV音频