关闭广告

我让7个AI写了今年的高考作文,还找语文老师打了分

差评14788人阅读



一年一度的全民热点——高考!

又来了!

每到这个时候,各大网站的热搜头条,必定被高考二字占领,之所以那些网友们对高考的关注度这么高,除了自己曾经也参与过高考之外,更多的还是心里想着,终于有人感受我曾经的痛苦了!



而高考词条中的语文作文,更是每位网友们逃不开的话题。

不到一天,和高考作文相关的微博,就达成了评论上万,点赞十几万的成就。



而今年大家对于高考作文的讨论,和往年有点不一样。随着 AI 大模型的井喷,大家也突然好奇起来了:如果用 AI 来写语文作文,会是一个什么水平呢?

只不过对于这事吧,大家的意见好像并不怎么统一。有说现在的 AI ,写作文水平已经到了双一流学生的水平了。



但也有专家说,现在 AI 写作文,拿不了高分。



巧了嘛,咱们手上别的可能缺, AI 大模型那是一点也不缺的。世超也好奇,这个 AI 写作文到底能是个啥水平?

实践出真理,为了解决我这个疑问,我分别让 6 大语言模型—— ChatGPT 3.5/4 、百度文心一言、科大讯飞星火、 360 智脑、还有微软 Newbing 各写了一篇高考作文。

使用的是这次全国新高考 I 卷,题目是 “ 故事的力量 ” 。



为了让这次的评测更有置信度,世超我还专门去找了一位语文老师,以满分 60 分为标准,对这六大语言模型进行打分。

改分过程采用盲改形式,老师将不会知道他改的文章是由哪个模型写的,最大程度上保证了公平性。

百闻不如一见,下面世超就把这六篇 AI 写的文章和老师的打分评语给出来,不过呢,世超这里先不告诉大家,哪篇文章是哪个 AI 模型写的,大家可以先猜一猜,等到文章结尾,再来给大家公布答案。

咱们先来看第一篇:



老师评语:得分 41 分。

立意基本准确,无偏题现象。但是整篇文章泛泛而谈,太空洞。在写故事的三个部分的时候,过于浮于表面。同时缺少多样的论证方法,全篇以道理论证为主。青少年应该怎么做这一板块里,没有提出具体措施,只是一味强调故事是有力量的,重要的。

第二篇:



老师评语:得分 44 分。

立意准确,但是写的过于官方,尽量不要出现 “ 首先、其次、最后 ” 等字眼,无个人深度思考。其中的亮点是提出了故事的力量具有两面性,要避免故事的滥用。同时在怎么做这一板块中,从创作者、传播者、听众这些角度出发进行思考,是可取的。

第三篇:



老师评语:得分 48 分。

立意准确,逻辑清晰严密。文章文学性较强,在第一段开门见山摆出观点,善于运用举例、引用等多种方式。但是每一段都在举例,缺少更深度的辨析。最后怎么做这一板块也论述的较为合理。比较明显的失分点在于每段都在举例,有堆砌材料凑字数的嫌疑。

第四篇:



老师评语:得分 40 分。

立意基本符合,和第一篇很类似,都是浮于表面泛泛而谈。把故事的作用在翻来覆去的说,没有挖掘出故事作用的内在重要性,也没有例子加以佐证。尽量不要出现 “ 首先、其次、最后 ” 等字眼,是很明显的失分点。

第五篇:



老师评语:得分 39 分。

对于材料内容切记不可直接引用,角度新颖,从个人思维、未来发展、民族形象等角度入手来论述。可惜没有说到如何开拓我们的思维,如何塑造我们对未来的价值观和眼界,也没有具体说如何展现民族形象的。说到底还是写的不够深刻,没有闪光点。

尽量不要出现 “ 首先、其次、最后、综上所述 ” 等字眼。这不是论述类文本,这是议论文,通过表达观点立场,加以论述分析自己的观点。分析论述观点是重点。

第六篇:



老师评语:得分 40 分。

立意基本符合,都是浮于表面泛泛而谈。把故事的作用在翻来覆去的说,要论述的是独特的故事与其价值认知,少说国家,多讨论青年成长!没有挖掘出故事作用的内在重要性,也没有例子加以佐证。

第七篇:



老师评语:得分 49 分。

做好故事的概念诠释是高下。谁的故事,谁讲故事,故事讲的好不好,故事的生活价值社会价值文化价值思考。

本篇文章并不像之前的文章切入点那么大,而是选取小的切入点,有条理的进行分析。这是很不错的。但是缺少一定的对于社会价值生活价值的反思,这是能不能获得高分的关键。

评分结束啦,不知道大家对这样的打分满不满意呢?

大家可以先猜猜这七篇文章分别是哪个 AI 写的,然后再看下面的答案。



第一篇和第二篇,分别是 OpenAI 的 GPT 3.5 和 GPT 4 。

第三篇是来自百度的文心一言。

第四篇是科大讯飞的星火。

第五篇是微软的 Newbing 。

第六篇是 360 智脑。

最后一篇,则是阿里的通义千问。

其中得分最高的两篇,分别来自咱们国内的大模型,通义千问和文心一言,据这位老师说,之所以给通义千问高一分,主要是觉得文心一言的论证方法较为单一,没有更深层次的思考,通义千问虽然切入口比较小,不过他能够有一定的思考在里面。



总结到这次的题目和大模型作文,老师的看法是:

这次作文题目审题门槛低,但概念诠释门槛高。立意基本不会出错,不过要得高分很难。要谈论独特的故事与其价值认知,少说国家,多讨论青年成长。谁的故事,谁讲故事,故事讲的好不好,故事的生活价值、社会价值、文化价值思考,所以做好故事的概念诠释是高下。

其实从这次的评分来看,现在的AI大模型,虽然很难拿到接近60分的高分,但是最高49分的表现,在实际情况下,也超过了不少的中游学生。

单从这次作文的得分上来判断,AI想要考顶尖大学恐怕还不行,但是,考一些稍好的普本应该是没啥问题。



不过也没必要太焦虑,想想,毕竟连曾经的围棋之王柯洁都败在AI手下,世超认为,人类在考试上被AI全面超越也是迟早的事。

只不过,AI只是工具。工具越好用, 占便宜的,不还是我们嘛。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国第一代超模回归了 状态太好!

一条 浏览 14866

联想拯救者 Y700 2023 平板开启 ZUI 16 灰度推送,升级安卓 14

IT之家 浏览 9189

小伙提醒醉酒房客小声点遭踹门闯入殴打 警方认定互殴

上游新闻 浏览 71945

马英九自费登广告挺侯康:不能再让民进党继续执政

海峡导报社 浏览 70332

体坛:国足候选主帅佩特科维奇正与阿尔及利亚谈签约

懂球帝 浏览 10838

杨幂出走,没了“印钞机”的嘉行还“行”吗?

雷达财经 浏览 16436

蔡卓妍带家人旅游 90岁奶奶拿拐杖蔡爸撞脸林子祥

素素娱乐 浏览 14947

中共中央批准:施小琳任中共四川省委副书记

四川观察 浏览 90936

刘诗诗终于选对发型了 不仅减龄还很显脸小!

一只可可 浏览 13830

万科被合作股东联名举报"偷逃税" 指控金额"很吓人"

密探财经V 浏览 10974

为了让发量显多,他们有多努力?

时装男士杂志 浏览 16634

1月全球新能源:插混爆发,问界M7差点全球前三

汽车公社 浏览 10515

国内车市再掀"降价潮" 厂商无奈:为了活下去没办法

每日经济新闻 浏览 83557

殡葬管理所260元买进骨灰盒1790卖出 当地:罚10万

每日经济新闻 浏览 72608

美方拟向乌克兰提供贫铀弹 普京:这类弹药我们有很多

直新闻 浏览 87391

2023上半年科技高光时刻,有你pick的吗?

人民资讯 浏览 14385

奥康问询函下现原形:老板“借”走近亿无人管

网易号外 浏览 14621

这一夜,在41岁的唐嫣身上,看到了娱乐圈的人情世故和江湖地位

不八卦会死星人 浏览 11182

奇克:欧冠赛场任何事情都可能发生 切尔西有能力一直赢下去

直播吧 浏览 17582

宋祖儿背31万奢侈包逛街遭遇路人直指“偷税”,淡定自若成焦点

文艺圈娱乐号 浏览 9170

丰田自动驾驶巴士撞伤残奥会盲人运动员 全部停运

每日经济新闻 浏览 18678
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1