一年一度的高考来了 国产大模型谁的作文写的好?

珠江路在线   2024年6月11日  【 转载 】VR电影网 

  本文标签:讯飞

一年一度的高考再次登上热搜,上一年高考,ChatGPT以及国产大模型首发团队文心一言、讯飞星火、阿里通义千问等掀起大模型写作文的大混战,有的号称满分,有的被批零分,有的文采有余情感缺乏…… 通过一年的 工夫这些大模型 威力是不是有大幅 晋升?恰好今年的高考题目就与人工智能有关,我们来看看谁家“孩子”能拿下高分?我们测评了国内知名的五家大模型产品:百度文心一言、科大讯飞星火、Kimi、腾讯元宝、阿里通义千问 。

先说 论断:讯飞星火,完胜 。Kimi只不过给了一个稿件提纲, 其余则陷入了题干中对于“问题”的陷阱中 。

新课标Ⅰ卷作文题目:

随着互联网的 遍及、人工智能的 利用,越来越多的问题能很快得到答案 。那么,我们的问题是不是会越来越少?

以上 材料激发了你 怎么的联想和思量?请写一篇文章 。

要求:选准角度,确定立意,明确文体,自拟 题目;不要套作,不得 抄袭;不得泄露个人信息;不少于800字 。

讯飞星火

文心一言

腾讯元宝

KIMI 

通义千问

我们再看一遍这道作文题:

随着互联网的 遍及、人工智能的 利用,越来越多的问题能很快得到答案 。那么,我们的问题是不是会越来越少?

以上 材料激发了你 怎么的联想和思量?请写一篇文章 。

这道题的题眼是“问题”二字,浏览 材料里“问题”浮现了两次,这两个“问题”其实是不同的内涵,依据新华词典的解释,第一个“问题”对应着“答案”,是“要求 答复或解释的题目”的意思,而第二个“问题”是“需求探究并加以解决的矛盾、疑难”的意思, 能够说第一个“问题”是狭义的,第二个“问题”是广义的, 类似英文中question和problem的不同 。

文心一言、腾讯元宝、通义千问、Kimi都掉进了第一个“问题”的陷阱,向来在 反复对于好奇、求知、解答、 常识这些浅层话题,而讯飞星火显而易见分辩出了两个“问题”的不同 含意,在文章中段就将 探讨 规模从狭义的需求个体解答的“小问题”蔓延到了广义的人类社会一起面对的“大问题” 。

这体现的不是 容易的“考试状态”,其背后 充足体现了星火大模型在语言 了解这一大模型核心 威力上的率先 。

为了能更好打分,我们依照全国高考作文评分 标准对几篇文章做 详尽 综合


文心一言:

根底等级方面,文章始终没有对互联网和人工智能对解决问题和产生问题的核心做出解读,显而易见偏离题意 。 构造方面, 只管有“首先……其次……再者……综上所述”这样看似 谨严的 构造 支撑,但段落和段落中间,段落和 论断中间,关系并不密切 。

进展等级方面,文心一言分别 引用了爱因斯坦、牛顿的名言和一句古诗, 判若两人的“掉书袋”看似有创意、有文采,但 细心看来,其内在逻辑其实 比较 混乱, 比方这一段 。

牛顿的话是对于科学传承,对这名言的 引用显然有“驴唇不对马嘴”的觉得 。

总体打分:35分

科大讯飞

根底等级方面,开篇点题,中段在“个体体验、信息爆炸、人工智能道德伦理”三个方面 综合问题,结尾回归“人类的智慧、勇气和 信念”升华价格,内容和 抒发无懈可击 。

进展等级方面,深刻与 丰盛做得很好,文采和创意有所欠缺,星火是唯逐个个通篇没有 引用名人名言的“考生”,像是个 谨严的理科生 。

总体打分:55分

腾讯元宝

对题 目标 了解更加 狭隘,觉得通篇向来在 反复一种观点“问题是个好东西”,这是大模型语言 了解 威力欠佳的 体现 。每一句话都自然流畅,名言 引用也 比较 适当,但全部句子凑在一起产生了一种“废话连篇”的觉得,这是大模型文本生成 威力欠佳的 体现 。毕竟腾讯元宝在5月底方才公布, 兴许不能要求太高 。

总体打分:32

Kimi

作为以长文本著称的大模型,高考作文 理当是Kimi 大显 本领的机会,但 后果却令小编有些意外,Kimi输出的文章在内容上并无特殊之处,最大的区别是它给每一段外加了小 题目,没 展示出长文本 了解和生成的核心 威力,却有 类似“ 题目党”的小 目标?只能 感慨:“Kimi真是个小灵巧鬼 。”

总体打分:42

通义千问

上一年的高考作文AI写作中,通义千问饱受诟病,被批“空洞没 养分”,今年的通义千问有显而易见 遍及 。通义千问的 长处跟讯飞星火一样,具备语言 了解和文本 抒发的广度和深度,缺陷跟文心一样, 舛误 引用名人名言刻意 展示文采, 堪称集众家所长,及所短 。

总体打分:49

Chatgpt 问世以来,“写文章”成为人工智能大模型产品 展示 威力的 广泛 目标,高考作文有着严格明确的要求,以及 绝对 谨严科学的评分 标准,无疑是最佳的试金石 。通过本次测评显而易见看出,讯飞星火大模型在语言 了解和文本 抒发上的 体现更胜一筹,拿高分实至名归,你们觉得呢?固然各位也 能够 打开手机或者电脑试试看,如高考作文题目所言,随着互联网的 遍及、人工智能的 利用,这个问题能很快得到答案 。

免责声明:凡标注转载/编译字样内容并非本站原创,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。