爆点资讯

这项由谷歌、范德比尔特大学、康奈尔大学等多家知名机构联合开展的研究发表于2025年，论文编号为arXiv:2510.00263v1。研究团队由来自谷歌的李卓航、李晓伟等研究者领导，联合了包括谷歌DeepMind、阿尔伯塔大学、弗吉尼亚理工大学以及Scale AI等机构的专家。有兴趣深入了解的读者可以通过论文编号arXiv:2510.00263v1查询完整论文。

当我们在网上购物时，经常会看到商品评价出现分歧——同一件商品，有人给五星好评，有人只给三星。这种现象在现实生活中司空见惯，因为每个人的标准、喜好和价值观都不同。然而，当前的AI评判系统却像一个固执己见的审判官，总是试图给出唯一的"标准答案"，完全忽视了人类判断中本就存在的多样性和不确定性。

这个问题在AI领域变得越来越严重。现在，许多AI系统都在使用其他AI作为"自动评判员"来评估和改进AI的表现，这种做法被称为"AI当法官"。但这些AI评判员都是按照传统方式训练的，它们只学会了给出单一的判断结果，就像一个只会说"对"或"错"的机器。这种简单粗暴的评判方式丢失了人类判断中的丰富信息，也抹杀了少数派的观点。

研究

谷歌AI实现类人判断解决系统偏见问题

44岁李小璐...

油车首搭华为...

速卖通正在成...

baby相隔...

邓超金鸡奖闹...

哈马斯高层在...

上海男子进不了门有家难回崩溃求救网友狠狠共情了

1欧元买18架战机罗马尼亚与荷兰以＂象征性价格＂签署购机合同

美媒承认：乌重镇即将被攻克

拉波尔塔：这场胜利来得正是时候；亚马尔一如既往地出色

光伏“卖铲人”去年净利腰斩

世体：因身体轻微不适，巴萨新援帕西菲科首秀将推迟

以总理＂碰瓷＂中国媒体：找错了对象更开错了药方

《重影》：高叶的这场被侵犯戏，被扇耳光，让人看了扎心的痛

温峥嵘回应卖面膜争议，已报警刑事立案

模速为核智领未来——徐汇人工智能产业的蝶变之路｜“十四五”答卷

新增1.2T发动机新款Tata Punch官图发布

E句话| 她疑似有新恋情了？

莫斯科空域遭侵袭多位中国游客滞留

激怒特朗普 BBC身陷数十年来＂最严重危机＂

近半年“主观VS量化”！但斌、吴悦风位列前5！翰荣、念觉领衔

口袋 AI 设备 Rabbit R1 更新，引入全新堆栈式卡片界面

雷军怒了！澄清其言论被断章取义

茅台跌落价格神坛！53度飞天茅台补贴价跌破1700元，释放信号明显

贵金属风口催生7连板！白银有色涨势凌厉，基本面却“拖后腿”

李纯马頔机场被偶遇，有说有笑画面温馨

连续三个月创历史新高蔚来公司10月新车交付首超4万台

安踏投资加速，主品牌却有些掉队了

港媒曝光何超莲家中资产分配，签不签婚前协议，窦骁都捞不到好处

清华团队破解：大模型训练崩溃之谜