关闭广告

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者1722人阅读


这项来自香港中文大学、AWS智能AI部门、亚马逊云服务和亚马逊机器人团队的联合研究发表于2025年1月,论文编号为arXiv:2601.02356v1。研究团队由谭靖、张兆阳、沈彦涛、蔡嘉瑞等多位学者组成,有兴趣深入了解的读者可以通过该编号查询完整论文。

想要修改照片里的物体位置,过去总是需要专业的图像处理软件和复杂的操作技巧。现在,AWS的研究团队开发出一种全新的AI系统叫做TALK2MOVE,只需要简单地说出你的想法,比如"把杯子往左移动"或者"把椅子转90度",AI就能准确地完成这些操作。这就像拥有了一个非常聪明的助手,能够完全理解你的语言指令并在照片中精准执行。

这项研究的核心创新在于采用了强化学习的训练方式,可以把它理解为让AI通过反复练习来学会精准操作的过程。不同于传统方法需要大量配对的"修改前后"图片来训练,TALK2MOVE采用了一种更加聪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

前任自杀,现任小25岁,他算渣吗?

麻辣婊 浏览 1694

农妇在荒塘内开挖养鱼被控"非法占用农地罪" 家属发声

极目新闻 浏览 8366

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西 浏览 2322

2026年央视春晚彩排开始!沈腾马丽回归,但呼声最高的是他们

娱乐圈笔娱君 浏览 1791

蔚来跌超6%三季度亏30亿,理想由盈转亏,零跑盈利,造车新势力洗牌加剧

21世纪经济报道 浏览 2286

和不扫兴的人在一起多重要?看完花少7后,精神状态都被治愈了

娱乐圈笔娱君 浏览 2691

Word再见!华为和WPS联手攻克难题:一句话生成PPT、PDF/Excel大文件秒开

快科技 浏览 1485

刘涛为95花作配,国民女星的资源降级还是新机遇?

八卦三缺一 浏览 3477

意大利比萨大学:让AI神经网络高效处理信息的新技术ParalESN

科技行者 浏览 1429

67岁梁家辉春晚彩排现场 三鞠躬视频刷屏网络

黄大姐 浏览 1424

低成本、高锐度布局风口上的创新药

一地基毛 浏览 2526

59-61超低分!齐麟0分丢绝杀三分新疆惜败浙江 程帅澎19分

醉卧浮生 浏览 1449

乌克兰袭击莫斯科一座热电站 距克宫仅百余公里

上观新闻 浏览 2358

《王牌对王牌》:玩不到一起真尴尬

洲洲影视娱评 浏览 2459

每天干十几个小时,月赚五六千元,有人6万元盘下,几个月后2万多才脱手!曾经爆火的创业项目遭嫌弃

都市快报橙柿互动 浏览 1647

以色列民众反对进攻加沙 民意与政府撕裂加剧

海外网 浏览 3385

特朗普:“国际部队”将进驻加沙地带

每日经济新闻 浏览 2609

采用插混动力 奇瑞风云A7谍照曝光

车质网 浏览 567

受够了网红滤镜的6亿人,为何涌入高德?

虎嗅APP 浏览 1769

破亿品牌数增长,3万品牌成交翻倍,今年双11的商业变革悄然开始

一点财经 浏览 2672

何小鹏:中美自动驾驶同处第一梯队;好未来发布AI智能体“九章龙虾”|早资道

封面新闻 浏览 564
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1