假设一万个初始数据每秒钟进行十次排列组合文字转WAV音频