两大可商用开源大模型同时发布！性能不输LLaMA，羊驼名字不够了

2023-05-09 05:30:08 admin 人工智能已售次关注170次已收录

梦晨发自凹非寺

量子位 | 公众号 QbitAI

从Meta的LLaMA发展出的羊驼家族一系列大模型，已成为开源AI重要力量。

但LLamA开源了又没全开，只能用于研究用途，还得填申请表格等，也一直被业界诟病。

好消息是，两大对标LLaMA的完全开源项目同时有了新进展。

可商用开源大模型来了，还一下来了俩：

MosaicML推出MPT系列模型，其中70亿参数版在性能测试中与LLaMA打个平手。

Together的RedPajama（红睡衣）系列模型，30亿参数版在RTX2070游戏显卡上就能跑。

对于这些进展，特斯拉前AI主管Andrej Karpathy认为，开源大模型生态有了寒武纪大爆发的早期迹象。

MPT，与LLaMA五五开

MPT系列模型，全称MosaicML Pretrained Transformer，基础版本为70亿参数。

MPT在大量数据（1T tokens）上训练，与LLaMA相当，高于StableLM，Pythia等其他开源模型。

支持84k tokens超长输入，并用FlashAttention和FasterTransformer方法针对训练和推理速度做过优化。

在各类性能评估中，与原版LLaMA不相上下。

除了MPT-7B Base基础模型外还有三个变体。

MPT-7B-Instruct，用于遵循简短指令。

MPT-7B-Chat，用于多轮聊天对话。

MPT-7B-StoryWriter-65k+，用于阅读和编写故事，支持65k tokens的超长上下文，用小说数据集微调。

MosaicML由前英特尔AI芯片项目Nervana负责人Naveen Rao创办。

该公司致力于降低训练神经网络的成本，推出的文本和图像生成推理服务成本只有OpenAI的1/15。

RedPajama，2070就能跑

RedPajama系列模型，在5TB的同名开源数据上训练而来（前面提到的MPT也是用此数据集训练）。

除70亿参数基础模型外，还有一个30亿参数版本，可以在5年前发售的RTX2070游戏显卡上运行。

目前70亿版本完成了80%的训练，效果已经超过了同规模的Pythia等开源模型，略逊于LLamA。

预计在完成1T tokens的训练后还能继续改进。

背后公司Together，由苹果前高管Vipul Ved Prakash，斯坦福大模型研究中心主任Percy Liang，苏黎世联邦理工大学助理教授张策等人联合创办。

开源模型发布后，他们的近期目标是继续扩展开源RedPajama数据集到两倍规模。

One More Thing

来自南美洲的无峰驼类动物一共4种，已被各家大模型用完了。

Meta发布LLaMA之后，斯坦福用了Alpaca，伯克利等单位用了Alpaca，Joseph Cheung等开发者团队用了Guanaco。

以至于后来者已经卷到了其他相近动物，比如IBM的单峰骆驼Dromedary，Databricks的Dolly来自克隆羊多莉。

国人研究团队也热衷于用古代传说中的*，如UCSD联合中山大学等推出的白泽。

港中文等推出的凤凰……

绝的是哈工大基于中文医学知识的LLaMA微调模型，命名为华驼。

参考链接：

[1] https://www.mosaicml.com/blog/mpt-7b

[2]https://www.together.xyz/blog/redpajama-models-v1

[3]https://twitter.com/karpathy/status/1654892810590650376?s=20

— 完 —

量子位 QbitAI · 头条号签约

以上就是【两大可商用开源大模型同时发布！性能不输LLaMA，羊驼名字不够了】的相关内容，查看其它ai资讯请关注微咔网

服务及版权声明

根据二〇〇二年一月一日《计算机软件保护条例》第十七条规定：为了学习和研究软件内含的设计思想和原理，通过安装、显示、传输或者存储软件等方式使用软件的，可以不经软件著作权人许可，不向其支付报酬。

本网站所有发布的源码、软件和资料，均为作者提供或网友推荐收集各大资源网站整理而来，仅供功能验证和学习研究使用。

所有资源的文字介绍均为网络转载，本站不保证相关内容真实可信，同时不保证所有资源100%无错可用，也不提供相应的技术支持，介意勿下。

您必须在下载后24小时内删除，不得用于非法商业用途，不得违反国家法律，一切关于该资源的商业行为与本站无关。

如果您喜欢该程序，请支持正版源码，得到更好的正版服务。、如有侵犯你的版合法权益，请邮件与我们联系处理【投诉/建议发送至邮箱：3066548754@qq.com】，本站将立即改正并删除。

本声明为本站所有资源最终声明，所有与本声明不符的表述均以本声明内容为准。

微咔网 » 两大可商用开源大模型同时发布！性能不输LLaMA，羊驼名字不够了

admin 皇帝

分享到：

相关推荐

现在2023年，买下的256G手机，是否能还满足需求？

现在2023年，买下的256G手机，是否能还满足需求？

巴菲特认为AI就是原子弹:威力太大改变世界

巴菲特认为AI就是原子弹:威力太大改变世界

ChatGPT太火美国*准备动手了

ChatGPT太火美国*准备动手了

动态丨李志飞退回出门问问，“拖家带口”能做好大模型吗？

动态丨李志飞退回出门问问，“拖家带口”能做好大模型吗？

如果你想做大模型时代的应用层创业……｜量子位·视点 x 一览科技

如果你想做大模型时代的应用层创业……｜量子位·视点 x 一览科技

中国AIGC50榜单出炉，AIGC前景如何？未来会如何影响人们生活？

中国AIGC50榜单出炉，AIGC前景如何？未来会如何影响人们生活？

AI生图以假乱真！人工智能自己都分不出真假了

AI生图以假乱真！人工智能自己都分不出真假了

数字化转型升级之工业元宇宙与AIGC

数字化转型升级之工业元宇宙与AIGC

特惠红包
博客
模式
更新
日历
本站
指数

运营天数：1861+

资源总数： 35320+

用户总数： 3733+

今日更新：0+

访问次数：9707813+

本周更新： 0+

最后更新： 2023-11-4
全屏

享更多特权，建议使用 QQ 登录

喜欢我嘛？喜欢就按“ctrl+D”收藏我吧！♡