按照传统的理解是为了稳固下盘文字转WAV音频