然后由空间自动为自己提取里面的信息文字转WAV音频