关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者2754人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新东方员工再出新歌"骂"公司 俞敏洪曾奖励12万

界面新闻 浏览 7979

全智贤风波升级,雪花秘扇时期表现被审判,此前曾多次翻车

扒虾侃娱 浏览 3588

报告称机械硬盘价格触底反弹,平静2年后将迎新一轮涨价潮

IT之家 浏览 2103

柬埔寨拒引渡3名韩国籍"杀猪盘"头目回韩国:就地审判

红星新闻 浏览 8105

碧姬·芭铎,“穿衣自由”概念的祖师奶

时尚COSMO 浏览 1441

美乌代表:佛州会谈"富有成效和建设性"

上观新闻 浏览 1998

媒体:伊各方誓言赢得战争 美国现在即使想退出也很难

环球网资讯 浏览 32412

众泰还魂?追觅新车实车照曝光:一比一复刻宾利添越

三言科技 浏览 2288

趁换代前“捡漏”30万豪华中型SUV之选

网易汽车 浏览 3657

俄无人机救下一名正遭乌军性侵女子 顾不上提裤子拔腿就逃

大象新闻 浏览 2811

苏丹快速支援部队宣布同意实行人道主义停火

国际在线 浏览 2528

杨明洋:感谢罗慕洛为我助攻,也感谢南通球迷一直支持我

懂球帝 浏览 2834

美联储报告:政策不确定性成头号金融稳定风险,央行独立性首次被点名,关注金融杠杆

华尔街见闻官方 浏览 2531

行驶超7万公里,初代问界M5满足国标涉水、底部撞击、火烧要求

IT之家 浏览 2169

女子连续偷吃5个蛋挞 转身大摇大摆走掉

极目新闻 浏览 21167

男子夜钓遭枪击 家属:4人当场逃跑 伤者走回家后倒地

封面新闻 浏览 8338

艾科维曾通过外部客户转贷逾千万元 两家“0人”供应商合计撑起超五千万元采购额

金证研 浏览 2868

花费498万买进"百强县"榜单被通报 辽宁海城官方回应

中国新闻周刊 浏览 5453

金标大众:在智能电动时代,守护那份“看不见”的安心

时代周报 浏览 1833

乌克兰一地遭俄军无人机密集袭击 基辅实施紧急停电

每日经济新闻 浏览 1649

小萨博尼斯适合勇士吗? 三大缺点阻碍他加盟

仰卧撑FTUer 浏览 1975
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1