与文科相比,大模型的理科成绩要差很多,最高分还不到480分,多数大模型的理科总分在400分以下,数学普遍不及格,相比河南理科511分的“一本”线,大模型还需努力。
重点考查实验探究能力的化学和物理试卷,各模型平均分更是只有34分和39分(满分为100和110)。化学单项最高分由豆包获得,成绩为49.5分,GPT-4o仅有42分。
如上提到,大模型理科普遍不行,成绩要差很多,在数学、物理、化学等数理学科上差距极大,包括GPT-4o在内的所有大模型都无法达到及格水平。大模型的理科最好成绩还无法进入人类考生的前30%。
具体看,在立住“问题”后,豆包随即用反问句自然过渡,引出三个排比段提出解决问题的方法。然后用发展的眼光分析问题,结合现实生活揭示问题产生的根源和危害的部分颇为亮点。
大模型处理自然语言方面的能力不容置疑,三款国产大模型产品获得了语文考试前三名,分别是百小应、字节豆包和腾讯元宝,得分依次为128分、125.5分和120.5分。丢分主要在语文写作上。
作为本次评测的语文作文阅卷人,北京市级骨干教师、怀柔区语文学科带头人夏老师曾多次参加全国高考语文阅卷。夏老师认为:“Al写出的文章大多有清晰完整的结构,有逻辑性,语言通顺流畅。但其理性有余,感性不足,缺乏感情色彩,自然就缺乏感染力。”
在历史和政治两科中,测试选手中有三至四家能达到80%以上的得分率。历史单科的桂冠归属豆包82.5的平均分。出乎意料的是,地理考试是文综三科中大模型表现最差的,最高分仅仅是 GPT-4o的68分。原因之一可能是地理涉及图片更多,AI识图能力有待提升。
在匿名阅卷中,豆包获得阅卷老师的好评:文章中显出的对就业结构、伦理方面的担心,展现出豆包已经具有不错的思想深度和思辨能力。
99热 国产 精品河南省教育考试院公布的高考录取分数线,文科本科一批分数线为521。根据测试结果,这意味着,GPT-4o、豆包、文心4.0、百小应等四款AI大模型在测试中的得分冲上了“一本”线。
大模型在高考英语测试中的优势更是压倒性的。一张150分满分的英语卷子,平均分达到132分,其中客观题几乎都是满分或接近满分,丢分主要在应用文写作和读后续写的作文部分,表达空泛、缺少细节上是弊端。
以数学试卷为例,9款大模型产品中,仅GPT-4o、文心一言4.0和豆包获得60分以上成绩(满分150分),目前的大模型只能正确推理步骤相对简单的问题。
633.68MB
查看784.93MB
查看69.6MB
查看796.20MB
查看854.75MB
查看784.34MB
查看353.42MB
查看432.52MB
查看483.68MB
查看349.25MB
查看261.60MB
查看129.85MB
查看276.39MB
查看311.63MB
查看112.86MB
查看624.14MB
查看307.16MB
查看836.76MB
查看110.66MB
查看651.30MB
查看749.34MB
查看799.67MB
查看394.75MB
查看746.82MB
查看487.31MB
查看352.59MB
查看688.57MB
查看652.77MB
查看424.25MB
查看409.13MB
查看768.98MB
查看271.78MB
查看465.24MB
查看324.92MB
查看487.46MB
查看203.10MB
查看787.22MB
查看296.26MB
查看258.18MB
查看939.83MB
查看922.53MB
查看346.41MB
查看364.41MB
查看872.48MB
查看715.86MB
查看832.28MB
查看200.59MB
查看668.88MB
查看200.47MB
查看391.33MB
查看181.64MB
查看240.29MB
查看228.99MB
查看353.83MB
查看925.13MB
查看376.25MB
查看447.50MB
查看181.76MB
查看132.79MB
查看543.62MB
查看150.60MB
查看138.57MB
查看973.33MB
查看414.76MB
查看527.91MB
查看944.30MB
查看850.91MB
查看429.30MB
查看418.24MB
查看961.98MB
查看211.37MB
查看639.13MB
查看718.35MB
查看981.57MB
查看338.69MB
查看711.87MB
查看852.59MB
查看281.29MB
查看688.40MB
查看630.38MB
查看970.43MB
查看394.95MB
查看958.69MB
查看275.24MB
查看571.85MB
查看140.87MB
查看151.11MB
查看699.15MB
查看436.84MB
查看632.99MB
查看728.71MB
查看787.99MB
查看469.25MB
查看569.42MB
查看154.23MB
查看711.55MB
查看356.28MB
查看490.33MB
查看456.60MB
查看406.63MB
查看600.42MB
查看236.94MB
查看947.81MB
查看303.48MB
查看
152 井冈山tf
Manner单店平均收入8000元一天⚳
2025-07-01 12:35:07 推荐
126 188****3017
小钰谈和Rookie结婚⚷
2025-07-01 14:52:08 不推荐
981 152****5116
为什么不建议左撇子考口腔医学⚻
2025-06-30 21:17:05 推荐
92 阿sue做棒冰中文版
谢娜在女儿毕业典礼上哭了⚾
2025-06-30 0-1:51:28 推荐