无论如何都不会低于第一阶段的60%文字转WAV音频