这代表着他终于初步摆脱了单纯的复制文字转WAV音频