而是会在人群中选择一个少年文字转WAV音频