这样确实可以用最短的时间内选出最优秀的人文字转WAV音频