所获得的所有视频情报必须经过详细的人工分析文字转WAV音频