InfoQ 研究中心：《大语言模型综合能力测评报告（2023）》（全文）-亚洲电脑网

InfoQ 研究中心：《大语言模型综合能力测评报告（2023）》（全文）

2023-05-30 15:16:16来源：网经社

(资料图)

ChatGPT 这一现象级产品横空出世，拉开了大语言模型技术蓬勃发展的序幕。但实际上，自 2017 年大语言模型诞生，OpenAI、微软、谷歌、Facebook、百度、华为等科技巨头在大语言模型领域的探索持续不断，ChatGPT 只是将大语言模型技术推进至了爆发阶段，当下大模型产品格局更是呈现出了新形势——国外基础模型积累深厚，国内应用侧优先发力。

2022年年末以来，人工智能大模型成为技术领域乃至全球创新领域最炙手可热的话题。以ChatGPT引领的大模型产品发展日新月异，有预测数据显示，到2030年，AIGC的市场规模或将超过万亿人民币。2023年国内主要厂商也相继推出自研的大语言模型产品，另外国内也推出了大量的大语言模型应用，逐步构建起基于中文语言特色的大语言模型生态。

为此InfoQ研究中心基于桌面研究、专家访谈、科学分析三个研究方法，查找了大量文献及资料，采访了10+位领域内的技术专家，同时围绕语言模型准确性、数据基础、模型和算法的能力、安全和隐私四个大维度，拆分出语义理解、语法结构、知识问答、逻辑推理、代码能力、上下文理解、语境感知、多语言能力、多模态能力、数据基础、模型和算法的能力、安全和隐私12个细分维度。

分别对ChatGPTgpt-3.5-turbo、Claude-instant、Sagegpt-3.5-turbo、天工3.5、文心一言V2.0.1、通义千问V1.0.1、讯飞星火认知大模型、Moss-16B、ChatGLM-6B、vicuna-13B进行了超过3000+道题的评测，根据测评结果发布了《大语言模型综合能力测评报告2023》。

扫码下载“ChatGPT ”报告

关键词：

相关推荐

InfoQ 研究中心：《大语言模型综合能力测评报告（2023）》（全文）

2023-05-30 15:16:16

两岸媒体豫冀行：合力传播“两岸一家亲”的正能量_环球滚动

“非遗”如何助推乡村文化振兴。“我们已连续多年举办两岸媒体联合采访活动，合力传播‘两岸一家亲’的正能

海特高新：5月29日融资净买入24.49万元，连续3日累计净买入120.84万元

5月29日，海特高新（002023）融资买入398 64万元，融资偿还374 15万元，融资净买入24 49万元，融资余额4 73

世外桃源6cccccc藏宝图攻略_6cccccc世外桃源藏宝图

你们好，最近小活发现有诸多的小伙伴们对于世外桃源6cccccc藏宝图攻略，6cccccc世外桃源藏宝图这个问题都颇

这类芯片在AI服务器中至关重要量价齐升趋势确定焦点日报

机构指出，AI时代浪潮汹涌，海量数据催生庞大的算力需求，带动AI服务器需求量与日俱增，用于服务器内、外部

房地产行业洗牌走向深入:多只ST地产股面临退市,信心仍有待回归-世界热头条

据澎湃新闻统计，截至目前，已有*ST蓝光（600466 SH，蓝光发展）、*ST中天（000540 SZ，中天金融）、ST美置

绫里真宵gif（绫里真宵）-最新快讯

来为大家解答以下的问题，里真宵gif，绫里真宵这个很多人还不知道,现在让我们一起来看看吧！1、4代没有交代

V型锚固件的详细介绍！建议收藏环球精选

V型锚固件的详细介绍！建议收藏V型锚固件起粘接整体性窑衬和窑体的作用，钢纤维和锚固件都经受高温长期作用

关于开展2022年度游戏产业政策相关事项申报的通知-每日头条

各相关企业：为贯彻落实《北京经济技术开发区游戏产业政策》（京技管〔2020〕98号）的工作要求，现开展2022

速读：核酸采样板块5月29日跌0.26%，晶雪节能领跌，主力资金净流出3.99亿元

5月29日核酸采样板块较上一交易日下跌0 26%，晶雪节能领跌。当日上证指数报收于3221 45，上涨0 28%。深证成

传智教育5月29日快速反弹

以下是传智教育在北京时间5月29日14:23分盘口异动快照：5月29日，传智教育盘中快速反弹，5分钟内涨幅超过2%

热门：外媒：消息人士称，预计马斯克本周访问中国，系3年来首次访华

【环球网报道】据路透社5月29日报道，3名知情人士透露，预计美国电动汽车制造商特斯拉首席执行官埃隆·马斯

当前观点：闰四月送留娘糕什么意思啊_闰四月送留娘糕什么意思

1、在我国民间，有“闰月年，留娘年”的说法，认为闰月年对母亲的身体健康不利。2、2、有些地方有女儿的人

5月29日基金净值：天弘中证全指证券公司ETF联接A最新净值0.9901，跌0.71%

5月29日，天弘中证全指证券公司ETF联接A最新单位净值为0 9901元，累计净值为0 9901元，较前一交易日下跌0 7

环球资讯：湖北房县“嘹亮人儿”调解工作室：婚约聘礼起纠纷，巧妙调解化干戈

民主与法制网讯（□王中正通讯员夏旭东鲍麟李丰竹）没有嘹亮人儿调解室的及时调解，我的聘礼不知道何时才能

全球时讯：哈兰德:“我们必须一次专注于一场决赛。现在我们只...

哈兰德:“我们必须一次专注于一场决赛。现在我们只关注足总杯决赛，希望结果会很好。我真的很期待，我有信

紧急提醒！一男子“二阳”后耳聋

近日一些小伙伴“二阳”后反映“二阳”的症状比“首阳”轻没有出现高烧不退、水泥鼻、刀片嗓这些典型的症状

今日拜拜love歌词（求《拜拜,爱过》的歌词）

拜拜love歌词，求《拜拜,爱过》的歌词很多人还不知道，现在让我们一起来看看吧！1、拜拜。2、爱过演唱：SAR

血糖健康开拓者！华为WATCH4 Pro评测：全面的腕上守护专家

总的来说，华为WATCH4Pro率先在血糖健康领域迈出了第一步，在佩戴手表过程中实现无感检测，而且免采血的血

天天快消息！太康县召开2023年“扫黄打非”进基层工作培训会

周口日报全媒体记者张洪涛为全面推进“扫黄打非”基层站点规范化标准化建设及示范点创建工作，维护好基层文

世界微速讯：注意！西安气象台发布未来6小时雷电黄色预警

西安市气象台2023年05月29日12时18分发布雷电黄色预警信号：预计未来6小时内未央区、新城区、碑林区、莲湖

焦点报道:豆汁和豆浆的区别（豆汁和豆浆的区别是什么）

来为大家解答以上问题。豆汁和豆浆的区别，豆汁和豆浆的区别是什么这个很多人还不清楚，现在一起跟着来瞧瞧

湖北五峰公路文化园成网红打卡点全球即时

湖北五峰公路文化园成网红打卡点---5月20日，自驾到湖北省五峰土家族自治县的武汉市民刘立先与朋友，被351

世界快看：缘何超九成住院患者愿意在县域治疗

“村卫生室做心电图、县医院远程诊断，检查结果刚出一会儿，120急救车便赶到了村里，将我送往县医院……”

五月天演唱会杭州站门票什么时候开售？天天日报

购票预售时间：2023年5月30日（二）10:55演出日期：2023 06 18(日)–06 19(一)演出场地：黄龙体育中心体育

货车上泡沫起火顷刻吞没全车警醒：车上需常备灭火器

5月29日消息，近日，一条监控视频在网路上得到流传，不少人看完之后表示后怕，更有人直接去下单了灭火器，

笔记本

11024用户共享10K超高清3D世界首款元宇宙服务器发布 2苹果iPhone SE3国行正式发售有什么亮点？ 3拼搏过，就没有遗憾！ | 画里有话 4为电动自行车拧紧“安全阀” 5哥斯达黎加总统新冠检测呈阳性 6南四湖专案300天，检察听证全网直播 7银牌中国雪上天团好样的 8“防疫版”冰墩墩是社区防控的有益尝试 9勇于挑战自我，终将收获更好的自己 10利比亚国民代表大会选举巴沙加为新总理