第三种是专门用来集群抛射文字转WAV音频