关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者2658人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

邓炳强称火势蔓延过快不寻常 事发楼栋居民发声

经济观察报 浏览 31207

德转为金球奖竞争评级:登贝莱最被看好,亚马尔为最大竞争对手

直播吧 浏览 3730

特朗普呼吁立即停火 遭俄方坚决驳斥

财联社 浏览 2814

贴广告的ChatGPT,一夜之间让全球网友破了防

机器之心Pro 浏览 1667

跨年档票房惨淡!5部新片全部倒挂,《寻秦记》情怀满满却难回本

萌神木木 浏览 1922

储朝晖:应对“入学潮”,推动教育提质增效

环球网资讯 浏览 2129

7年联姻终止!蔚来合资公司注销

敖博管理 浏览 3506

浙BA决赛G3丽水队59-58杭州队避免被横扫,倪豪凯砍33分+准绝杀

懂球帝 浏览 1430

进博面对面|默沙东中国总裁唐凯宇:加速推动医药创新成果落地中国

中国商报 浏览 2697

中网女单第三轮利斯挑落莱巴金娜

体坛周报 浏览 3382

利空突袭!暴跌50%!

券商中国 浏览 1850

伊土两国外长:地区国家应共同应对以色列侵略扩张

环球网资讯 浏览 2265

最长纯电续航335km 智己LS8动力曝光

车质网 浏览 1653

【进博时刻】每天训它几百遍,这份枯燥的工作并非冷冰冰

上观新闻 浏览 2196

特朗普:俄乌接近达成协议 就顿巴斯问题尚未达成一致

红星新闻 浏览 23319

《逍遥》大结局:纪严下线订单终于到达,最终还是领导了结了他!

肆季娱乐 浏览 1889

25岁女孩海岛求生赛吃老鼠蜈蚣 35天暴瘦28斤

潇湘晨报 浏览 7086

记者:切尔西曾询问过范戴克的情况;目前考虑冬窗引进新后卫

懂球帝 浏览 1761

微创、高效、直达大脑!我国科学家开辟脑卒中病灶给药新路径

环球网资讯 浏览 1669

达成停火22天内 仅有商定数量24%的卡车进入加沙

上观新闻 浏览 2517

胡塞武装:以军空袭萨那致9死174伤 包括大量妇女儿童

极目新闻 浏览 3344
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1