数百个不同场景的监控画面文字转WAV音频