并在新的可视化环境里物理和数字对象共存文字转WAV音频