试图从人家跟自己画面的对比中文字转WAV音频