可是按照他们达到的时间来打分的文字转WAV音频