沈永亮则从初代 UI-TARS 到 UI-TARS 2.0 做了很好的点评:「 UI-TARS 1.0 走了一条视觉原生的端到端路线,通过构建人工标注数据和进行大规模的 SFT、DPO 训练,向行业证明了只要数据飞轮转起来,不依赖各种花式 workflow 的纯视觉方案也能走的通 。后续版本这种领先优势进一步从感知延伸到了推理和环境交互。UI-TARS 1.5 让我们看到了强化学习在处理复杂任务时的关键作用,紧接着 UI-TARS 2.0 推出沙盒环境,让模型能够进行无限的数据 Scaling,通过在虚拟环境中不断试错和生成数据,实现了左脚踩右脚式的自我迭代提升。 这一整套从纯视觉感知到沙盒自我进化的研究闭环,无疑是目前行业里最前沿的探索。 」
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。
全部评论