是通过在视频中反复插入一些诱导性的画面文字转WAV音频