观众基本不会一直注意脸部的微妙表情变化――电影可以用特写文字转WAV音频