肯定不会是平均分配了文字转WAV音频