看来这是因为实力不同而划分的文字转WAV音频