关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者857人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:自家老牌车企落后中美 欧盟恐对中国车厂下手

澎湃新闻 浏览 8038

真宿敌!枪手旧将拉姆塞打趣布伦南-约翰逊:真希望他没去热刺

直播吧 浏览 14119

向佐郭碧婷逛街被偶遇,1岁儿子在母亲怀里熟睡

扒虾侃娱 浏览 16295

痛惜!资深音乐人突发意外去世,很多人听过他的歌...

可乐谈情感 浏览 685

迪士尼将对OpenAI进行10亿美元股权投资

第一财经资讯 浏览 30

新美联储通讯社:美联储暗示暂停降息行动,新债王:今天或是鲍威尔任内最后一次

华尔街见闻官方 浏览 56

央妈受不了了!澳洲央行加倍QE 全球市场受提振

华尔街见闻 浏览 26388

珠峰3具著名遗体20年无人安葬:1人被称"睡美人"成地标

社会奇闻君 浏览 92078

普通人秋天就该这么穿,准备几件黑色单品和牛仔服饰,简约又百搭

静儿时尚达人 浏览 800

2023上半年科技高光时刻,有你pick的吗?

人民资讯 浏览 16237

美国微软公司:10月14日起Windows 10将“停服”

财闻 浏览 983

米体:那不勒斯球迷在客场遭殴打,德国警方逮捕9名法兰克福球迷

直播吧 浏览 18974

近年来首次 福建省委书记出席全省对台工作会议

政知新媒体 浏览 91712

35岁男子回乡"崖下洞居" 创业失败家里没房欠银行35万

封面新闻 浏览 12449

奥巴马带着妻女与好莱坞演员汤姆·汉克斯聚餐

译言 浏览 15602

小S二女儿穿粉色衣服向芭比致敬 妩媚眨眼引热议

每日新鲜事吖 浏览 14348

世体:拉波尔塔率队访问布鲁日,参加接待仪式并漫步市中心

懂球帝 浏览 661

"1999年小朋友捐140元给国家造航母"热传 当事人发声

都市快报橙柿互动 浏览 4981

《老友记》五人组发联合声明悼念马修:无比悲痛

网易娱乐 浏览 14112

马斯克动人类脑子的计划又进一步,西湖大学研发出1平方毫米大小神经芯片,你准备好在脑子里装芯片了吗?

都市快报橙柿互动 浏览 16332

陈凯歌做梦也没想到,竟有一天会因儿子陈飞宇,实现口碑暴增

温柔娱公子 浏览 1440
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1