如果两三代没有出现什么明显短板的话文字转WAV音频