AI大战高考作文：瞎编、凑字数、万能套路

鞭牛士 • 2023年6月8日 22:38:01 • 看热点 • 阅读 6

这届高考，应该是过去五年来，最特殊的一次。因为多了一个新角色——AI考生。

第一天的语文考试刚结束，全网就掀起AI作文大赛。ChatGPT、文心一言、通义千问等AI大模型，被人们拿来写高考作文。几秒钟就能生成一篇，不仅速度惊人、逻辑严密，还能引经据典。

乍一看，AI大模型写作文，简直太轻松，似乎对人类构成降维打击。毕竟，论知识储备量，没有人可以跟AI比。AI把整个互联网上的资料都学习消化了，然后模仿人类的表达方式，用自己的逻辑输出。

但是，如果我们仔细分析AI考生的“答卷”，会发现AI并没有很多人想象的那样无所不能。AI大模型普遍存在的套路化写作、不会数数、胡说八道等问题，也在作文中出现。

事实上，按照高考作文的评分标准，AI生成的作文都存在某些方面的局限。战胜人类，目前还不现实。

深AI用高考作文测试了三款AI大模型——ChatGPT（OpenAI）、文心一言（百度）、通义千问（阿里），发现了一些有趣的结论。

比如，AI不会数数，文心一言、通义千问的作文都没有达到“不少于800字”的硬性要求；一本正经胡说八道的毛病还没改，为了凑字数可以车轱辘话来回说；AI写作文基本离不开套路，一个模板反复套用。

以下是详细内容，欢迎讨论。

一个没有感情的答题机器

今年高考全国甲卷的作文主题是“人·技术·时间”，要求以“人们因技术发展得以更好地掌控时间，但也有人因此成了时间的仆人”这句话展开，写自己的联想与思考。

我们先看一下教育部教育考试院发布的《试题解析》：考察逻辑思维和思辨能力。

划重点：引导考生深入思考信息时代理性分析和审慎判断的重要性。这是考察的一大内核。

深AI测试了三个大模型发现，它们都没有抓住这个内核——东拉西扯说一通，啥都说了但其实啥也没说。

先看ChatGPT的作文：

再看文心一言的：

最后看通义千问的：

这三篇作文，堪称顶级“端水大师”，围绕主题正反来回说，就是没有把“批判性思维”这个点说透。只有文心一言明确提到了“深入思考和批判性思维的培养”。

通义千问的作文是最空洞的。它把重点放在了“时间管理”上，偏离了主题，而且论述的道理也是人人皆知的常识。另外，通义千问的作文没有标题，扣分。

我们再用新课标I卷的作文试题“故事的力量”，看看三家的表现。

这篇作文要求根据以下这段话，写自己的联想和思考：好的故事，可以帮我们更好地表达和沟通，可以触动心灵、启迪智慧；好的故事，可以改变一个人的命运，可以展现一个民族的形象……故事是有力量的。

ChatGPT的作文：

文心一言的：

通义千问的：

不得不说，除了通义千问的作文相对平淡，其他两篇的表述方式、行文逻辑，尤其是用词还是可圈可点的。尤其是文心一言用场景化的开场方式，让人眼前一亮。

不过问题也是显而易见的——同一个事情用不同的话术翻来覆去说，导致全文读下来，给人一种“你说的我都知道”的感觉。

一个没有感情的答题机器，这是很多人的评价。

“内容空洞，车轱辘变着来回说。”有人评价。还有人说：“全是没营养没内涵的大白话。”

我们不妨拆解一下文心一言的这篇作文，就会知道什么是“车轱辘话”。

文中标黄、标绿的部分，都是完全相同的意思，甚至可以说是相同的话术，在文中反复出现。在文末“总结来说”标蓝的一整段，则是把文中的观点和话术，搞了个大杂烩。

这给人一种凑字数的即视感。

深AI更改提示词，让ChatGPT想象自己是一个在高考现场的考生，并再次写一篇作文，它上来第一句话就是“当我坐在这个考试的座位上时，我的手中拿着一只先进的电子笔......”

这样参加考试，估计会被判违规，直接零分。

没有灵魂，是AI作文最大的减分项。

套路，全是套路

为了让作文看起来像那么回事，AI用了很多套路。

它们很喜欢用“首先、其次、然后、最后”的句式。最典型的是ChatGPT，最后一段一定会是“总的来说……”

比如ChatGPT的这两篇作文：

文心一言、通义千问也有相似的套路。前面一顿输出猛如虎，最后一定用“总而言之”“总的来说”结尾。

这就跟弹吉他一样，只要掌握了万能和弦公式（比如万能的卡农进行），就能弹出上百首曲子。

甚至于，我们让文心一言给自己写的作文打分，它也是“首先、其次、此外、综上……”一顿长篇大论。

而在“人·技术·时间”的作文题中，ChatGPT和通义千问居然用了几乎完全相同的表述：用“那么”提出一个问题，用“首先、其次、最后”展开具体论述。框架和逻辑像是一个模子里刻出来的。

尽管如此，文心一言非常自信地给自己的高考作文打出了90分的高分（假设满分100分），还自我评价“值得肯定”。我们把它的作文丢给ChatGPT，ChatGPT竟然毫不吝啬地给出了100分的满分……

AI大模型就像工业流水线，批量生产作文。但本质上，无论它说出来的话多么像人话，驱动的技术都是数学和统计，而非意识。

在人工智能行业，让AI听懂人话、会说人话，一直以来都是一件很困难的事情。人类的自然语言是一个极其复杂的系统，科学家让机器模拟了人类大脑的神经网络，使其具备深度学习能力，但始终不具备跟人一样的自然语言能力。

于是有人另辟蹊径，把语言问题转化成数学问题，然后通过计算，间接解决自然语言处理的问题。按照自然语言处理专家吴军的说法：语言模型不是逻辑框架，不是生物学的反馈系统，而是由数学公式构建的模型。这其中的关键词是“数学”。

这决定了人工智能没有自我意识或情绪，无法根据个人感觉来说话。写作文对它们来说，是以结果和任务为导向的一种逻辑表达。

而通过抓取全网海量数据进行训练，不断学习模仿人类的语言表达方式，AI大模型现在说话已经非常接近人类，虽然它还不懂文字背后的意思，但不影响交流。

在根本上，AI没有自己的思想。这也是为什么它的作文看起来头头是道，仔细一品，你会发现没有灵魂，全是套路的根本原因。

AI真的不会数数

前面我们提到，语言模型的参数都是靠统计得出的。它的原理是给定一个文本的历史，预测下一个词的概率，然后补全下文。

2017年谷歌首次提出基于自我注意力机制（self-attention）的变换器（Transformer）模型，现在类似ChatGPT之类的语言大模型，都是建立在Transformer架构上。

Transformer的注意力机制比之前的RNN（循环神经网络）、GRU和LSTM等深度学习算法具有极长的记忆力。它还可以记住输入的顺序，所以能读懂“我爱你”和“你爱我”是不一样的意思。

但即便如此，它依然有局限。

比如，深AI让通义千问给它自己的作文打个分，它混淆了“你”和“我”的概念。开头说是它自己的文章，然后又说是“你”的文章……

《大模型时代》作者龙志勇对深AI解释，这可能是因为站在左右互搏的角度，换位了。

在测试AI大模型写高考作文的过程中，我们还发现一个有意思的现象——AI不会数数。

高考作文有一个要求是字数不少于800字。深AI跟大模型进行了多次互动，除了ChatGPT，文心一言和通义千问第一版交上来的作文都没有达到800字。

比如文心一言，深AI多次提醒，文章字数不够800，需要重写。文心一言每次都是：首先态度非常谦卑地道歉，保证一定符合要求，然后快速用十几秒钟的时间生成一篇新的作文——还是不到800字。

这个“考生”读不懂作文题，且屡教不改，是个大大的减分项。

龙志勇对深AI解释：“大模型预测下一个词的训练方式，没有让它学会数数，它并不知道800是多少，更不懂得数着字数来生成文章。”

事实上，别说800，连10这样的数字，文心一言也数不清。

这是语言模型普遍存在的问题。至于为什么数不清，什么时候、通过什么办法就能数清，目前还没有结论。“虽然有一些提示工程的技巧可以帮助它数数，但并不是通用的解法。大模型现阶段就是靠做黑箱实验来验证它的能力，靠做黑箱训练来提升它的能力。”龙志勇说。

在龙志勇的建议下，深AI更改提示词，输入“内容再丰富，再长一些”，文心一言输出的作文超过了800字。

在前面的高考作文题中，ChatGPT的作文超过了800字，但其实，它也没学会数数。

ChatGPT这样对深AI解释：

所以，其实“优等生”ChatGPT的作文字数达标，是靠蒙的。它也不知道800字是多少，就尽可能多写点。

还不能完全听懂人话，但又具备超强的知识储备和表达能力，就导致有时候会出现让人哭笑不得的场面。

从这次AI大战高考作文的结果来看，大模型的写作能力已经有很大进步。在选词用词、逻辑论述、引经据典方面，甚至超过很多人。

不过，对作文质量的评价，本身带有主观因素，不像数学题一样只有唯一正确答案。好看的词句千篇一律，有趣的灵魂万里挑一。如何给作文注入灵魂，AI大模型还没玩明白。AI大模型固有的一些问题，也还需要通过技术迭代慢慢解决。

本文内容（包含图片或视频在内）系用户自行上传分享，网站仅提供信息存储服务。如作品内容涉及版权问题，请及时与鱼捕头联系，我们将在第一时间删除。文章地址：https://www.yubutou.com/31756.html

赞 (0)

0 0

OpenAI掌门人最新访谈：几十年内AI能治愈所有疾病，也能产出最强病毒

上一篇 2023年6月8日 22:37:46

柯以敏直播卖课多次遭到学员辱骂，大发雷霆表示要报警

下一篇 2023年6月8日 22:38:41

看热点

消息称小米Redmi K70 Pro手机将搭载骁龙8 Gen 3处理器、5000万像素主摄

IT之家9 月 4 日消息，今天上午 @数码闲聊站的一句话爆料中，出现了一款代号为“Manet”的新机。按照他的说法，这台新机将搭载高通SM8650处理器，5000万像素主摄镜头…

鞭牛士
2023年9月4日
70
看热点

汕头查封玉蕾等4家腌制菜厂，全部立案

鞭牛士 3月16日消息，3月14日晚，广东“3·15”晚会曝光了汕头市龙湖区外砂腌制菜和“玉蕾牌橄榄菜”的食品安全问题，受到广泛关注。当晚，汕头市连夜组织专项整治行动，相关职能部…

鞭牛士
2023年3月16日
230
看热点

“国内最大”催收公司永雄集团宣布停业

鞭牛士 5月26日消息，据第一财经消息，5月25日凌晨，国内催收行业负有盛名的湖南永雄资产管理集团有限公司宣布从当天起停业。永雄集团号称“国内最大”的催收公司。目前尚不清楚永雄集…

鞭牛士
2023年5月26日
70
看热点

美团直播迈出关键一步

美团正在加快直播业务的发展速度，并给予直播更充沛的流量入口。先是，在北京、上海、成都等地的美团外卖APP首页上，“美团神抢手”直播间占据屏幕上半部分。如今，美团APP首屏推荐位正…

鞭牛士
2023年7月21日
40
看热点

48小时卖出5000条裙子，6年创业淘宝卖家“吓坏了”

一天卖出3000多条花裙子，店主“吓坏了” 陈绵羊从没想过，开了6年的原创女装淘宝店SIBLEU居然是以“这种方式”火出圈的。 6月7日下午，网络上忽然爆出一则新闻“国企高管牵手…

鞭牛士
2023年6月11日
340
看热点

滴滴推出多项措施全力保障亚运出行服务

鞭牛士 9月25日消息，第19届亚运会于杭州开启，亚运会赛事期间正值中秋、国庆假期，观赛人员和游客数量有大幅提升，为满足市民出行与外地游客需求，滴滴于近日上线多种措施，全力护航亚运…

鞭牛士
2023年9月25日
40
看热点

马斯克：中国汽车制造商是最具竞争力的

鞭牛士 10月9日消息，今日一个汽车博主在X分享了全球最畅销电动汽车榜单，马斯克回复此贴评论到“根据我们的经验，中国汽车制造商是最具竞争力的。” 该榜单显示，今年前8个月全球最畅销…

鞭牛士
2023年10月9日
20
看热点

大佬进修潮！罗振宇进北大历史研修班学习，周鸿祎上清华攻读博士

鞭牛士 8月26日消息，继360董事长周鸿祎「考上」清华大学后，今天又有得到APP创始人罗振宇进入北大历史研修班学习。从罗振宇发布的朋友圈图片可以看出，罗振宇作为北京大学历史研修…

鞭牛士
2023年8月26日
20
看热点

传定价7000元，蔚来手机会有未来吗？

蔚来手机就要上市了。近期，多个省份的蔚来车友群收到了手机购买意向收集表。该表显示，只要参与购买意向问卷调查并在手机正式开放购买后72小时内付款，即可获得车友会定制礼包。此前，蔚…

鞭牛士
2023年8月20日
50
看热点

东方甄选APP直播脱离抖音？俞敏洪：彼此成就，正常行为不要过度解读

近日，新东方旗下直播带货平台东方甄选在APP上开启直播的事情，引发外界对东方甄选要“脱离抖音”的猜测。7月9日晚上，新东方创始人俞敏洪在直播中回应称，东方甄选和抖音的关系非常好，彼…

鞭牛士
2023年7月10日
20

发表回复

登录后才能评论

联系我们

17896001082

在线咨询： QQ交谈

邮件：2718562165@qq.com

工作时间：周一至周五，9:00-18:00，节假日休息