被平均分摊到每一个人身上文字转WAV音频