「豆包手机」为何能靠超级Agent火遍全网,我们听听AI学者们怎么说

玩法测评发表于 2026-05-21 19:48 阅读：0

沈永亮则从初代 UI-TARS 到 UI-TARS 2.0 做了很好的点评：「 UI-TARS 1.0 走了一条视觉原生的端到端路线，通过构建人工标注数据和进行大规模的 SFT、DPO 训练，向行业证明了只要数据飞轮转起来，不依赖各种花式 workflow 的纯视觉方案也能走的通。后续版本这种领先优势进一步从感知延伸到了推理和环境交互。UI-TARS 1.5 让我们看到了强化学习在处理复杂任务时的关键作用，紧接着 UI-TARS 2.0 推出沙盒环境，让模型能够进行无限的数据 Scaling，通过在虚拟环境中不断试错和生成数据，实现了左脚踩右脚式的自我迭代提升。这一整套从纯视觉感知到沙盒自我进化的研究闭环，无疑是目前行业里最前沿的探索。」

本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体)，仅供学习参考。用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权，请联系我们反馈本站将在三个工作日内改正。