在这个过程当中肯定会出现所谓的误伤和其他状况文字转WAV音频