关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2645人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

许利民:争取让赵睿在窗口期前打两场,曾凡博腰伤因训练不系统

懂球帝 浏览 1608

或于2026年推出 比亚迪大汉谍照曝光

车质网 浏览 2020

泽连斯基:准备进行领土谈判

参考消息 浏览 2811

再见了沈腾,再见了贾玲,再见了沙溢!活得好好的已经被大家怀念

阿雹娱乐 浏览 2246

限韩令太正确!全智贤辱华不道歉,林允儿发文挑衅,韩星嚣张得治

不八卦会死星人 浏览 3349

光伏“卖铲人”去年净利腰斩

网易财经 浏览 1413

售14.98万 方程豹钛3推501km后驱Ultra版

网易汽车 浏览 2615

秦昊带9岁女游国外,米饭百元自叹国内物价廉

松林侃世界 浏览 2704

保时捷出事故保险公司让报废 但只赔100万保额的一半

大象新闻 浏览 23441

国开新型政策性金融工具投放近1900亿元

央视财经 浏览 2663

媒体:放弃全球霸权 背叛美国的美国已不再自信

南风窗 浏览 7021

翻拍一部剧,有这么难吗?

时尚COSMO 浏览 1632

枪手又被黑?塔帅称VAR的解释不对

体坛周报 浏览 1602

智元精灵G2机器人正式发布,已获得数亿元订单

三言科技 浏览 2797

网友曝姚晨新欢是侯雯元!二人交集被扒

萌神木木 浏览 579

杨鸣:广东三外援轮番冲击让我们顾此失彼;今晚年轻人的表现值得表扬

懂球帝 浏览 1740

美媒:乌方认为美对乌施压力度远大于对俄 美官员否认

环球网资讯 浏览 2146

比朔夫:最喜欢的球员是维蒂尼亚和基米希;梅罗选谁?梅西

懂球帝 浏览 1736

商务部公告附件首次改为wps格式 此前多为doc或pdf

上游新闻 浏览 2921

尹同跃宣告奇瑞AI进入2.0时代,要快速追赶特斯拉FSD

贝壳财经 浏览 1617

华盛顿大学与耶鲁大学联手:医疗数据库为何让顶尖AI模型"抓狂"

科技行者 浏览 1719
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1