关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者892人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

鹅厂机器狗:学完真狗子的运动数据,真有二哈那感觉了

量子位 浏览 16002

听到特朗普再次出庭受审 希拉里放声大笑:他危险了

海外网 浏览 92219

科学家发现首个中等质量黑洞,质量约为太阳的142倍

趣看热点 浏览 25648

海信发布两款颠覆级激光显示新品,显示产业形态创新迈向关键拐点

IT之家 浏览 1593

《速度与激情9》即将上映,主创们开始忙着宣传,避免不了讨好一下中国市场

趣看热点 浏览 27162

孙艺珍出席新年慈善义卖 淡妆盘发笑容甜状态超好

素素娱乐 浏览 13167

全新奔驰C级纯电版曝光,续航或750公里,2025年上市

Nice好车 浏览 12633

MIT研究发现:人工智能已经可以取代美国11.7%的劳动力

华尔街见闻官方 浏览 334

张馨予否认生二胎,声称这几天馒头主食吃的太多了

趣看热点 浏览 26108

鲁尼:萨拉赫应该回撤参与协防;范戴克的进球应该算作有效

懂球帝 浏览 591

你是真狠啊!威少飞身抢板 布伦森左手给了他脸一巴掌

直播吧 浏览 12546

男子收1300万元拆迁款后被控敲诈勒索获刑 终审无罪

极目新闻 浏览 4916

今天,“港股实名制”落地!

中国基金报 浏览 19567

买插混车盯紧这个数!明年可能多花上万元

中新经纬 浏览 1006

25岁女孩欠二十万外债抑郁失联到底是怎么回事?

趣看热点 浏览 129095

黑色大衣 + 基础款,洋气炸了!

小西的穿搭日记 浏览 13333

疯狂!又两大车企大降价!

电动知家 浏览 12557

中国2023年12月规模以上工业增加值同比增长6.8%

国家统计局 浏览 12754

拼多多“千亿扶持”落地半年,“包邮区”持续扩大,更多地区享受便利网购服务

雷峰网 浏览 569

泫雅疑官宣恋情!与龙俊亨同步发牵手照,想要支持,公司:确认中

文艺圈娱乐号 浏览 12966

美股周一:三大股指全线下跌,纳指跌逾1%,特斯拉跌超6%

网易科技报道 浏览 15699
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1