原本拥挤的人流自动向两旁分开文字转WAV音频