还是把它采集成mP4格式的视频文字转WAV音频