清华发布大模型性能报告:GPT-4第一 更懂中文的还是百度
2023-08-10 14:32:39 来源:快科技
(相关资料图)
8月10日消息,AI大模型成为今年的热点,OpenAI的ChatGPT一马当先,微软、谷歌、Meta紧随其后,国内科技巨头也迅速跟进,现在国内据说已经有上百款大模型问世了。
这么多大模型中,实力到底如何?日前清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》,将国内外的大模型做了一番对比。
该报告还探讨了这些模型在不同知识领域,如创意写作、代码编程、舆情分析、历史知识等方面的回答情况,以及其在解决实际问题中的有效性和局限性。
从生成质量、使用与性能、安全与合规三个维度,对目前市场上的7个大型语言模型进行了全面的综合评估。
在这7款大模型中,GPT-4获得了毫无悬念的第一,第二名是百度的文心一言,其次是GPT-3.5,后面就是Claude、讯飞星火、阿里云的通义千问及昆仑的天工。
虽然GPT-4各方面领先,但是对国内用户来说,更懂中文的大模型才是关键,这方面百度的文心一言更好,在部分中文语义理解方面,文心一言以92%的得分率排名榜首,超越讯飞星火、GPT-4。
这跟百度的大模型包含大量中文文本有关系,因此能够更好地处理本土文化相关的内容。
关键词:
相关阅读
-
清华发布大模型性能报告:GPT-4第一 更...
清华发布大模型性能报告:GPT-4第一更懂中文的还是百度, 8月10日消 -
京东研究院发布《七月电影消费观察》
七月以来,封神、李白、芭比的关键词热度高涨,搜索量同比分别提升了43 -
QFII、社保、券商最新重仓股曝光
随着上市公司2023年半年报的陆续披露,社保、QFII、券商等机构投资者的 -
暴爽疯狂赛车2什么时候出 公测上线时间预告
导读:最近很多玩家都在关注暴爽疯狂赛车2这款手游,想知道具体的公测 -
网游之我是boss他娘(网游之我是boss)
1、网游之我是Boss我怕谁txt全集小说附件已上传到百度网盘。2、点击免 -
2023工银安盛人寿御享欣生重疾险保什么?...
工银安盛人寿御享欣生重疾险是由工银安盛人寿承保的重疾险。这款产品最 -
国际学生领略纺织文化魅力 创意家纺好神奇
8月9日,“Amazing,黄河!”外国留学生山东行参访团来到滨州市愉悦... -
题材股是什么意思(题材股是指哪些股票)
题材股是什么意思题材股是什么意思其实就是指与一些股票挂钩的股票,这 -
第三方检测市场规模增速亮眼 第三方检...
第三方检测市场规模增速亮眼由于检测行业服务万业的特点,不仅受益于现 -
第六届进博会展客商开启“提前供需对接...
新华社上海8月9日电(记者周蕊)记者从第六届中国国际进口博览会技术装 -
一半是海水,一半是火焰!儋州火山海岸...
海南环岛旅游公路儋州火山海岸驿站于2022年12月开工建设,目前正在建设 -
晋江市晋东新区已开发面积达1.1万亩
晋江市晋东新区是晋江全面对接融入泉州环湾规划的“桥头堡”和“主... -
1斤面粉做月饼皮配方?
一斤面约做月饼皮十二只,一、做月饼用什么面粉?一般来说,做月饼用普 -
《七里河公园多盏路灯“失明”》后续多...
近日,市民侯女士来电反映,七里河公园步道边有几处照明灯坏了,晚间部 -
近期发生多起醉驾导致的群死群伤事故 ...
中新网8月8日电据公安部交通管理局官方微信消息,近期,云南、西藏、广 -
丰泽人大开展义务教育优质均衡发展专题调研
泉州网8月9日讯(记者张沼婢)9日,丰泽区人大常委会组织部分市、区两 -
天风证券给予恒力石化买入评级,拟分拆...
天风证券06月24日发布研报称,给予恒力石化(600346 SH,最新价:14 26 -
还吐槽吗?罗振宇透露芯片荒时 比亚迪...
还吐槽吗?罗振宇透露芯片荒时比亚迪曾借给其它厂商很多芯片 -
回天新材:公司年产3,600万平方米太阳能...
回天新材(300041)08月10日在投资者关系平台上答复了投资者关心的问题。 -
宣城市宣州区:目标导向、精准施策,助...
专稿:近年来,宣城市宣州区紧盯“培养造就高素质干部队伍”目标,...