他是忽略了旧技术和新技术的难度差距了文字转WAV音频