1. 首页 > 实时资讯

效果可达OpenAI等效模型96% 国产开源AI语言模型TigerBot发布

IT之家6月8日消息,国产多模态大语言模型TigerBot近日正式发布,包括70亿参数和1800亿参数两个版本,目前已在GitHub上开源。

图源TigerBot的GitHub页面据悉,TigerBot带来的创新主要在于:

一种提出指令以完成监督微调的创新算法提高了模型的可学习性

使用集成和概率建模方法来实现可控的事实和创造力

突破deep-speed in parallel training等主流框架内存和通信问题

此外,该模型还针对中文更不规则的分布,从tokenizer到训练算法做了更合适的优化。

虎博科技官网研究员陈烨表示:“该模型仅使用少量参数即可快速理解人类提出什么样的问题。根据OpenAI InstructGPT论文在NLP公开数据集上的自动评估,TigerBot-7B达到了同等规模OpenAI模型综合性能的96%。”

图源TigerBot 的GitHub 页面声称TigerBot-7B-base 的性能“优于OpenAI 的等效和可比模型”,开源代码包括双卡推理180B 模型的基本训练和推理代码、量化和推理代码。数据包括100G预训练数据,有监督微调1G或100万条数据。

东辰网的朋友可以在这里找到GitHub的开源项目。

本文由网络整理发布,不代表东辰网立场,转载联系作者并注明出处:https://www.ktwxcd.com/sszx/76971.html

留言与评论(共有 0 条评论)
   
验证码:

联系我们

在线咨询:点击这里给我发消息

微信号:vx614326601

工作日:9:30-18:30,节假日休息