又经过了长达半个多小时的统计文字转WAV音频