目标主要集中在六百米这个距离上的人群文字转WAV音频