商汤国产中文大模型全面领先ChatGPT 部分接近GPT-4-讯息

2023-06-21 22:38:31 来源: 快科技

快科技6月21日消息,在AI大模型领域,OpenAI的ChatGPT成为当前最火的大模型,也是标杆性的,多个国产大模型都要对标它,今天商汤科技公布了自己的大模型测试结果,三个测试项目中都超越了ChatGPT。

商汤科技自研中文语言大模型名为“商量SenseChat 2.0”,日前公布的测试显示,MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。


(资料图)

根据评测结果,“商量SenseChat 2.0”在三个测试集中表现均领先ChatGPT,部分已十分接近GPT4的水平,实现了我国语言大模型研究的重要突破。

这三个测试分别如下:

由美国加州大学伯克利分校等高校构建的多任务考试评测集MMLU;

微软研究院推出的学科考试评测集AGIEval(含中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等);

由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval;

在MMLU测试中,“商量SenseChat 2.0”综合得分为68.6,远超GLM-130B(45.7分)的得分,同时还超过了ChatGPT(67.3分)、LLaMA-65B(63.5分)仅落后GPT-4(86.4分),位居第二。

在AGIEval测试中,“商量SenseChat 2.0”测出49.91的分数,遥遥领先GLM-130B(34.2分)、LLaMMA-65B(34.0分),并再次超越ChatGPT(42.9分),仅次于GPT-4的56.4分。

在其中的AGIEval(GK)评测子集中,“商量SenseChat 2.0”以58.5分全面领先,仅微弱差距落后GPT-4(58.8分)。

在C-Eval测试中,“商量SenseChat 2.0”拿到了66.1的分数,在参评的18个大模型中,仅次于GPT-4(68.7分),全面领先ChatGPT、Claude、Bloom、GLM-130B、LLaMA-65B等一众海内外大模型。

截至目前,已有近千家企业客户通过申请,应用和体验“商量SenseChat 2.0”超强的长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力,并且“商量SenseChat 2.0”还在服务客户过程中,持续实现着快速迭代和提升,以及知识的实时更新。

关键词:

精选 导读

鱼化寨街道水利社区庆祝端午节向退休人员送关爱_天天聚看点

6月20日上午,西安高新区鱼化寨街道水利社区联合西安融合社会工作服务

发布时间: 2023-06-21 22:13
要闻   2023-06-21

世界微速讯:注意!杰瑞股份将于7月11日召开股东大会

杰瑞股份(SZ002353,收盘价:24 67元)6月21日发布公告称,2023年7月1

发布时间: 2023-06-21 21:34
要闻   2023-06-21

焦点要闻:长春破产法庭设立一周年 充分挽救有价值的危困企

中新网长春6月21日电(谭伟旗)记者21日从长春市中级人民法院获悉,长春

发布时间: 2023-06-21 20:49
要闻   2023-06-21

微导纳米:与滁州亿晶签署3.86亿元TOPCon电池设备销售合同

2023年6月21日,微导纳米(688147 SH)关于签订重大销售合同的公告,公司

发布时间: 2023-06-21 20:15
要闻   2023-06-21

环球资讯:英国政府债务62年来首次超过GDP

【英国政府债务62年来首次超过GDP】财联社6月21日电,英国《金融时报》

发布时间: 2023-06-21 19:23
要闻   2023-06-21

热点 推荐

商汤国产中文大模型全面领先ChatGPT 部分接近GPT-4-讯息

商汤国产中文大模型全面领先ChatGPT部分接近GPT-4

发布时间: 2023-06-21 22:38
国内   2023-06-21

国博推出“东方故乡——中华大地百万年人类史”展,清晰勾勒

我们是谁?我们从哪里来?这是人类一直在试图回答的问题。6月21日,“

发布时间: 2023-06-21 22:27
科技   2023-06-21

观热点:售89.9万起 全新丰田皇冠威尔法上市

[本站新车上市]6月21日,全新丰田皇冠威尔法正式上市,新车全系共推出2

发布时间: 2023-06-21 22:08
汽车   2023-06-21

鱼化寨街道水利社区庆祝端午节向退休人员送关爱_天天聚看点

6月20日上午,西安高新区鱼化寨街道水利社区联合西安融合社会工作服务

发布时间: 2023-06-21 22:13
要闻   2023-06-21

天天百事通!压力表量程范围是工作压力几倍_压力表量程范围

1、其实压力表的适用范围应该是量程的1 3~接近满量程处,被测压力太小

发布时间: 2023-06-21 21:56
IT   2023-06-21

当前观察:陆天明“中国三部曲”之二《沿途》以过来人亲历与

陆天明“中国三部曲”之二《沿途》以过来人亲历与年轻人对话---他,就

发布时间: 2023-06-21 21:38
国内   2023-06-21

天天视点!中寰股份股东陈亮减持141万股 减持总金额682.18

中寰股份股东陈亮减持141万股减持总金额682 18万2022年公司净利4464 28

发布时间: 2023-06-21 22:00
科技   2023-06-21

世界微速讯:注意!杰瑞股份将于7月11日召开股东大会

杰瑞股份(SZ002353,收盘价:24 67元)6月21日发布公告称,2023年7月1

发布时间: 2023-06-21 21:34
要闻   2023-06-21

预订16.99万起 深蓝S7 6月25日公布售价 全球新资讯

[本站资讯]日前,我们从深蓝汽车官方获悉,深蓝S7将于6月25日公布售价

发布时间: 2023-06-21 21:09
汽车   2023-06-21

8月上市 起亚EV6将于6月28日开启盲订

[本站资讯]日前,我们从起亚官方获悉,起亚中国首款纯电车型――起亚EV

发布时间: 2023-06-21 21:17
汽车   2023-06-21

6月26日上市 坦克500 Hi4-T配置曝光|快消息

[本站资讯]坦克500Hi4-T将于6月26日上市,日前,官方公布了该车的部分

发布时间: 2023-06-21 21:06
汽车   2023-06-21

中发展控股(00475)公布年度业绩 公司拥有人应占亏损1190.6

中发展控股(00475)公布截至2023年3月31日止年度业绩,收益约2 48亿港元

发布时间: 2023-06-21 21:06
IT   2023-06-21

端午假期前的杭州东站,这一次,他们最“粽”要的事是回家

潮新闻客户端记者滕一韬实习生余楚凡冯前又至端午小长假,也是今年上半

发布时间: 2023-06-21 20:55
国内   2023-06-21

当前聚焦:神农顶风景区

1、神农顶风景区在神农架西南部的自然保护区内,总面积约883 6平方公里

发布时间: 2023-06-21 20:54
科技   2023-06-21

焦点要闻:长春破产法庭设立一周年 充分挽救有价值的危困企

中新网长春6月21日电(谭伟旗)记者21日从长春市中级人民法院获悉,长春

发布时间: 2023-06-21 20:49
要闻   2023-06-21

当前信息:【主动创稳】全链条发力 打好主动创稳攻坚仗

主动创稳行动开展以来,武威市公安局凉州分局宣武派出所紧紧围绕“矛盾

发布时间: 2023-06-21 20:35
IT   2023-06-21

V观财报|*ST华仪涉嫌信披违规被立案,股价年内累跌超四成

中新经纬6月21日电华仪电气股份有限公司于21日收到中国证券监督管理委

发布时间: 2023-06-21 20:27
国内   2023-06-21

交钱就能“办学位”?假的!深圳已有多名家长中招

又到小学学位申请高峰期,为让孩子进入理想学校,家长们煞费苦心。一些

发布时间: 2023-06-21 20:14
科技   2023-06-21

微导纳米:与滁州亿晶签署3.86亿元TOPCon电池设备销售合同

2023年6月21日,微导纳米(688147 SH)关于签订重大销售合同的公告,公司

发布时间: 2023-06-21 20:15
要闻   2023-06-21

蔚来7月1日试运营 提供ET7与EL7两款车型

蔚来宣布,在7月1日起,在欧洲5个国家的11座城市试运营“目的地出行”

发布时间: 2023-06-21 20:06
IT   2023-06-21