百度文信排名第二!清华大学发布大型语言模型排名
作者:热心市民 • 更新时间:2024-05-15 14:16:57 •阅读
近日,清华大学新闻传播学院沉阳团队发布了《大语言模型综合性能评估报告》。报告选取了ChatGPT、文心一言、统一钱文等七大语言模型,重点围绕生成质量、使用性能、安全性、合规性三个维度,全面考察中文语义理解等20项指标以及大语言模型的逻辑推理。
在这7个大模型中,GPT-4毫无悬念地获得了第一名,第二名是百度的文心一言,其次是GPT-3.5,其次是克劳德、讯飞星火,还有阿里云的钱童一问昆仑天然匠心。
但对于国内用户来说,中文理解能力也是一个关键指标。整体来看,文心一言具有突出的语义理解能力。在部分中文语义理解方面,文心一言以92%的得分率排名第一,超过讯飞星火和GPT-4。
依托知识提升的核心特征,文心一言对当地语言的特点有更准确的把握,能更好地处理与当地文化相关的主题和背景,如诗歌、方言等,具有更强的国内落地性空间。
本文由热心市民发布,不代表东辰网立场,转载联系作者并注明出处:https://www.ktwxcd.com/sszx/271178.html