他们可以将眼中的景物变成半数据半实体的状态文字转WAV音频