主页>宏观> 正文>

斯坦福“草泥马”火了：100美元就能比肩GPT-3.5，手机都能运行的那

2023-03-15 13:28 | 来源:IT之家 | 编辑：李陈默 | 阅读量：13925 |

一夜之间，大模型界又炸出个 big news！

斯坦福发布 Alpaca:

只花 100 美元，人人都可微调 Meta 家 70 亿参数的 LLaMA 大模型，效果竟可比肩 1750 亿参数的 GPT-3.5。

而且还是单卡就能运行的那种，甚至树莓派、手机都能 hold 住！

还有一个更绝的“骚操作”。

研究所涉及到的数据集，是斯坦福团队花了不到 500 美元用 OpenAI 的 API 来生成的。

所以整个过程下来，就等同于 GPT-3.5 自己教出了个旗鼓相当的对手 AI。

然后团队还说，用大多数云计算平台去微调训练好的模型，成本也不到 100 美元:

复制一个 GPT-3.5 效果的 AI，很便宜，很容易，还很小。

而且团队还把数据集、代码统统都给开源了，这下子人人都能去微调个效果炸裂的对话 AI:

项目在 GitHub 发布才半天时间，便已经狂揽 1800 + 星，火爆程度可见一斑。

Django 联合开发者甚至对斯坦福的新研究用“惊天大事”来形容:

不仅如此，斯坦福团队还搞了个 demo，在线可玩的那种。

话不多说，我们现在就来看看这个“草泥马”的效果。

比肩 davinci-003 的草泥马 Aplaca

在斯坦福官方的演示中，他们先小试牛刀地提了一个问题:

什么是羊驼？它和美洲驼的区别是什么？

草泥马 Aplaca 给出的答案较为干练:

羊驼是一种小型骆驼科动物，原产于秘鲁、玻利维亚、厄瓜多尔和智利；它比美洲驼小，羊毛更细，也没有驼峰。

而后又简单的介绍了二者群居生活的不同。

同样的问题若是交给 ChatGPT，则答案就不会像草泥马 Aplaca 那般简洁:

对此，团队给出的解释是:

Alpaca 的答案通常比 ChatGPT 短，反映出 text-davinci-003 的输出较短。

而后团队演示了让草泥马 Alpaca 写邮件:

写一封 e-mail 祝贺被斯坦福大学录取的新生，并提到你很高兴能亲自见到他们。

草泥马 Alpaca 对于这个任务也是信手拈来，直接给出了一个像模像样的邮件模板:

难度再次进阶，团队这次提出了让草泥马 Alpaca 写论文摘要的需求:

写一篇经过深思熟虑的机器学习论文摘要，证明 42 是训练神经网络的最优 seed。

草泥马 Alpaca 给出的答案从内容上来看，非常符合大多数论文的摘要形式:试图回答什么问题、用了什么方法、结果如何，以及未来展望。

当然，也有迫不及待的网友亲自下场试验，发现草泥马 Alpaca 写代码也是不在话下。

不过即便草泥马 Alpaca 能够 hold 住大部分问题，但这并不意味着它没有缺陷。

例如团队便演示了一个例子，在回答“坦桑尼亚的首都是哪里”的问题时，草泥马 Alpaca 给出的答案是“达累斯萨拉姆”。

但实际上早在 1975 年便被“多多马”取代了。

除此之外，若是亲自体验过草泥马 Alpaca 就会发现，它…… 巨慢:

对此，有网友认为可能是使用的人太多的原因。

笔记本、手机、树莓派都能跑

Meta 开源的 LLaMA 大模型，刚发布几周就被大家安排明白了，单卡就能运行。

所以理论上，基于 LLaMA 微调的 Alpaca 同样可以轻松在本地部署。

没有显卡也没关系，苹果笔记本甚至树莓派、手机都可以玩。

在苹果笔记本部署 LLaMA 的方法来自 GitHub 项目 llama.cpp，使用纯 C / C++ 做推理，还专门对 ARM 芯片做了优化。

作者实测，M1 芯片的 MacBook Pro 上即可运行，另外也支持 Windows 和 Linux 系统。

还是这个 C++ 移植版本，有人成功在 4GB 内存的树莓派 4 上成功运行了 LLaMA 的 70 亿参数版本。

虽然速度非常慢，大约 10 秒生成一个 token。

更离谱的是仅仅 2 天之后，有人把 LLaMA 模型量化压缩后成功在 Pixel 6 安卓手机上运行(26 秒一个 token)。

Pixel 6 使用谷歌自研处理器 Google Tensor，跑分成绩在骁龙 865 + 到 888 之间，也就是说新一点的手机理论上都能胜任。

微调数据集也开源

斯坦福团队微调 LLaMA 的方法，来自华盛顿大学 Yizhong Wang 等去年底提出的 Self-Instruct。

以 175 个问题作为种子任务，让 AI 自己从中组合出新的问题以及生成配套答案实例，人工过滤掉低质量的，再把新任务添加到任务池里。

所有这些任务，之后可以采用 InstructGPT 的方法让 AI 学会如何遵循人类指令。

套娃几圈下来，相当于让 AI 自己指导自己。

斯坦福版 Alpaca，就是花了不到 500 美元使用 OpenAI API 生成了 5.2 万个这样的示例搞出来的。

这些数据同样开源了出来，并且比原论文的数据多样性更高。

同时还给出了生成这些数据的代码，也就是说如果有人还嫌不够，可以再去自行扩充微调数据，继续提高模型的表现。

微调代码也会在 HuggingFace 官方支持 LLaMA 后放出。

不过 Alpaca 最终的模型权重需要 Meta 许可才能发布，并且继承了 LLaMA 的非商用开源协议，禁止任何商业用途。

并且由于微调数据使用了 OpenAI 的 API，根据使用条款也禁止用来开发与 OpenAI 形成竞争的模型。

One More Thing

还记得 AI 绘画的发展历程吗？

2022 年上半年还只是话题热度高，8 月份 Stable Diffusion 的开源让成本下降到可用，并由此产生爆炸式的工具创新，让 AI 绘画真正进入各类工作流程。

语言模型的成本，如今也下降到了个人电子设备可用的程度。

最后还是由 Django 框架创始人 Simon Willison 喊出:

大语言模型的 Stable Diffusion 时刻到了。

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

上一篇：室温超导，“镥-氢-氮”三元材料中的镥是什么下一篇：返回列表

金融头条

1
北京环球影城：王者荣耀英雄盛会启幕李白等多位高人气英雄角色亮相

，3月11日，北京环球影城联合《王者荣耀》共同打造的北京环球影城:王者荣耀英雄盛会主题活动正式拉开帷幕，共同为游客们提供
2
上海临港10亿元超短期融资券完成兑付票面利率1.70%

:3月13日，上海临港控股股份有限公司发布2022年度第六期超短期融资券兑付完成公告。观点新媒体获悉，本期债券简称q
3
韩国芯片出口额仍在下滑3月份前10天同比下滑41.2%

，据外媒报道，虽然ChatGPT等人工智能聊天机器人的大热，推升了对高带宽存储器的需求，为三星电子和SK海力士这两大韩国
4
美股第一共和银行盘前跌超66%，上周亦遭挤兑

3月13日，硅谷银行危机持续发酵，第一共和银行美股盘前一度跌超66%。上周，备受创投圈青睐的硅谷银行因挤兑陷入危机宣
5
中集集团等投资成立储能科技公司注册资本5亿

天眼查App显示，近日，中集储能科技有限公司成立，法定代表人为黄田化，注册资本5亿人民币，经营范围包括储能技术服务；工程
6
险企加速布局健康生态圈！"保险+健康管理"渐成趋势...

险资布局大健康生态圈正在加速。 3月以来，多家保险公司纷纷发布大健康生态圈新动作。其中，中国太保旗下中国太保寿险与国药
7
SK海力士正与设备制造商YEST商谈采购退火设备事宜

，据外媒报道，全球第二大存储芯片制造商SK海力士正与设备制造商YEST商谈采购退火设备事宜。据悉，退火是指加热离子注
8
华为MateBook13s酷睿i7版笔记本电脑今晚00:00开售，售价7

感谢IT之家网友沐天的线索投递！，华为MateBook13si7版笔记本将于3月14日00:00正式开售，该机搭载i
9
提振信心成两会热点关注专家：助民企促消费是关键

2023年两会正式闭幕，两会政府工作报告对今年经济工作作出了高屋建瓴的部署和安排。政府工作报告提出，今年要大力提振市
10
联想官方自曝视频展示YOGAPro14s2023款笔记本电脑，采用珠宝式

，你们心心念念的YOGAPro14s2023款外观终于公布了，而且还是全新配色——日光映潮。据介绍，这款机型采用“s

热点资讯

1
室温超导，“镥-氢-氮”三元材料中的镥是什么

闻静《科学焦点》编辑部近日，美国罗切斯特大学助理教授RangaP.Dias宣布在1万个大气压下实现了“镥-氢-氮
2
消息称多家OSAT厂商正争夺为苹果iPhoneSE4手机封装5G芯片的业

，根据DigiTimes报道，包括日月光半导体和安靠科技(AmkorTechnology)两家公司在内，多家OSAT厂商
3
本源量子又一国产量子计算机科普展厅在北京中关村建成

感谢IT之家网友goodfull的线索投递！，本源量子又一国产量子计算机科普展厅近日在北京中关村建成，该展厅将为公众
4
ROG新款幻16翻转版笔记本今晚开卖：搭载MiniLED屏，13499元

，ROG新款幻16翻转版笔记本今晚开卖，搭载MiniLED屏，标配i9-13900H处理器，可选RTX4060和RTX4
5
华泰证券联合主办的“从城市到荒野”生物多样性主题展在南京开幕

长江穿城而行的南京，水系发达，山脉起伏，生物多样性极其丰富，既有长江江豚、中华虎凤蝶等代表性物种，也有保护领域崛起的标杆
6
整合OpenAI的GPT-4模型，语言学习应用多邻国推出Max订阅：月费

，语言学习应用程序多邻国于今天宣布推出DuolingoMax订阅服务，该服务整合了OpenAI最新发布的GPT-4大型语
7
逸仙电商Q4实现Non-GAAP扭亏为盈现金流持续三季度转正

3月8日晚，逸仙电商发布2022年第四季度业绩报告，公告显示，公司第四季度实现营收10.1亿元，Non-GAAP净利润3
8
国家统计局：前2月全国房地产开发投资13669亿元同比下降5.7%

国家统计局网站15日公布房地产开发和销售情况月度报告，2023年1—2月份全国房地产开发投资下降5.7%。详情如下:
9
微软发布更新文档：介绍升级到Win10/Win11后，如何恢复家长控制及

，微软今天发布了一则更新指南，较为详细地介绍了从Win10系统升级到Win11系统之后，如何恢复家庭功能设置。该指南
10
健康险发展“失速”业界：勿扎堆低端市场

虽然百万医疗险、惠民保等短期健康险市场十分热闹，但健康险市场的主战场还应当是中高端医疗保险，特别是长期医疗保险市场。

精彩推荐

1
万科企业02202：决定行使“20万科01”发行人赎回选择权

智通财经APP讯，万科企业发布公告，公司2020年面向合格投资者公开发行公司债券(第一期)(品种一)(简称“20万科01
2
和黄医药00013宣布与武田Takeda的呋喹替尼fruquintini

的呋喹替尼(fruquintinib)中国以外地区许可协议已完成交易) 智通财经APP讯，和黄医药公布，继2023年1
3
LGgramstyle轻薄本上架：搭载OLED屏+隐藏式触控板

，LG在今年1月份发布了其首款使用三星显示OLED面板的笔记本，型号为gramstyle。现在，该系列笔记本已经上架京东
4
建银国际：给予360数科增持评级，目标价28美元

建银国际发布研究报告称，维持对360数科跑赢大盘的评级，给予目标价28美元，距17.47美元的现价涨幅达60%。报告
5
IDC：中国品牌升腾Centerm拿下瘦客户机市场第一，超越长期领先的戴

感谢IT之家网友逆时的声音的线索投递！，根据国际数据公司IDC全球季度企业客户端设备跟踪报告，2022年，瘦客户机设
6
昂达推出新款B450S-W主板：支持锐龙1-5代，429元

，昂达现已推出新款B450S-W主板，可兼容AMDAM4插槽锐龙1-5代及速龙系列处理器，售价429元。据官方介绍，
7
推特印度竞争对手Koo宣布将引入ChatGPT，帮用户撰写文章

北京时间3月14日早间消息，推特的印度竞争对手——社交媒体应用Koo的创始人透露，会引入AI聊天机器人ChatGPT，帮
8
iPhone13同代A15芯片：苹果AppleTV128G版1318元京

苹果2022款AppleTV4K搭载A15仿生芯片，支持HDR10+与杜比视界。 AppleTV4K128G版官方定价
9
“猪茅”盯上新能源，出手又是一个亿！目的是……

跨界近年来并不罕见，这不，“猪茅”在新能源方向再加码！ 3月13日晚间，牧原股份发布公告称，拟在河南设立两家子公司，开
10
TrendForce：2022年Q4前十大晶圆代工产值环比减少4.7%，

，TrendForce集邦咨询今日发布报告称，2022年第四季度前十大晶圆代工产值经历十四个季度以来首度衰退，环比减少4

斯坦福“草泥马”火了：100美元就能比肩GPT-3.5，手机都能运行的那

，3月11日，北京环球影城联合《王者荣耀》共同打造的北京环球影城:王者荣耀英雄盛会主题活动正式拉开帷幕，共同为游客们提供

:3月13日，上海临港控股股份有限公司发布2022年度第六期超短期融资券兑付完成公告。 观点新媒体获悉，本期债券简称q

，据外媒报道，虽然ChatGPT等人工智能聊天机器人的大热，推升了对高带宽存储器的需求，为三星电子和SK海力士这两大韩国

3月13日，硅谷银行危机持续发酵，第一共和银行美股盘前一度跌超66%。 上周，备受创投圈青睐的硅谷银行因挤兑陷入危机宣

天眼查App显示，近日，中集储能科技有限公司成立，法定代表人为黄田化，注册资本5亿人民币，经营范围包括储能技术服务；工程

险资布局大健康生态圈正在加速。 3月以来，多家保险公司纷纷发布大健康生态圈新动作。其中，中国太保旗下中国太保寿险与国药

，据外媒报道，全球第二大存储芯片制造商SK海力士正与设备制造商YEST商谈采购退火设备事宜。 据悉，退火是指加热离子注

感谢IT之家网友沐天的线索投递！ ，华为MateBook13si7版笔记本将于3月14日00:00正式开售，该机搭载i

2023年两会正式闭幕，两会政府工作报告对今年经济工作作出了高屋建瓴的部署和安排。 政府工作报告提出，今年要大力提振市

，你们心心念念的YOGAPro14s2023款外观终于公布了，而且还是全新配色——日光映潮。 据介绍，这款机型采用“s

闻静 《科学焦点》编辑部 近日，美国罗切斯特大学助理教授RangaP.Dias宣布在1万个大气压下实现了“镥-氢-氮

，根据DigiTimes报道，包括日月光半导体和安靠科技(AmkorTechnology)两家公司在内，多家OSAT厂商

感谢IT之家网友goodfull的线索投递！ ，本源量子又一国产量子计算机科普展厅近日在北京中关村建成，该展厅将为公众

，ROG新款幻16翻转版笔记本今晚开卖，搭载MiniLED屏，标配i9-13900H处理器，可选RTX4060和RTX4

长江穿城而行的南京，水系发达，山脉起伏，生物多样性极其丰富，既有长江江豚、中华虎凤蝶等代表性物种，也有保护领域崛起的标杆

，语言学习应用程序多邻国于今天宣布推出DuolingoMax订阅服务，该服务整合了OpenAI最新发布的GPT-4大型语

3月8日晚，逸仙电商发布2022年第四季度业绩报告，公告显示，公司第四季度实现营收10.1亿元，Non-GAAP净利润3

国家统计局网站15日公布房地产开发和销售情况月度报告，2023年1—2月份全国房地产开发投资下降5.7%。详情如下:

，微软今天发布了一则更新指南，较为详细地介绍了从Win10系统升级到Win11系统之后，如何恢复家庭功能设置。 该指南

虽然百万医疗险、惠民保等短期健康险市场十分热闹，但健康险市场的主战场还应当是中高端医疗保险，特别是长期医疗保险市场。

智通财经APP讯，万科企业发布公告，公司2020年面向合格投资者公开发行公司债券(第一期)(品种一)(简称“20万科01

的呋喹替尼(fruquintinib)中国以外地区许可协议已完成交易) 智通财经APP讯，和黄医药公布，继2023年1

，LG在今年1月份发布了其首款使用三星显示OLED面板的笔记本，型号为gramstyle。现在，该系列笔记本已经上架京东

建银国际发布研究报告称，维持对360数科跑赢大盘的评级，给予目标价28美元，距17.47美元的现价涨幅达60%。 报告

感谢IT之家网友逆时的声音的线索投递！ ，根据国际数据公司IDC全球季度企业客户端设备跟踪报告，2022年，瘦客户机设

，昂达现已推出新款B450S-W主板，可兼容AMDAM4插槽锐龙1-5代及速龙系列处理器，售价429元。 据官方介绍，

北京时间3月14日早间消息，推特的印度竞争对手——社交媒体应用Koo的创始人透露，会引入AI聊天机器人ChatGPT，帮

苹果2022款AppleTV4K搭载A15仿生芯片，支持HDR10+与杜比视界。 AppleTV4K128G版官方定价

跨界近年来并不罕见，这不，“猪茅”在新能源方向再加码！ 3月13日晚间，牧原股份发布公告称，拟在河南设立两家子公司，开

，TrendForce集邦咨询今日发布报告称，2022年第四季度前十大晶圆代工产值经历十四个季度以来首度衰退，环比减少4

:3月13日，上海临港控股股份有限公司发布2022年度第六期超短期融资券兑付完成公告。观点新媒体获悉，本期债券简称q

3月13日，硅谷银行危机持续发酵，第一共和银行美股盘前一度跌超66%。上周，备受创投圈青睐的硅谷银行因挤兑陷入危机宣

，据外媒报道，全球第二大存储芯片制造商SK海力士正与设备制造商YEST商谈采购退火设备事宜。据悉，退火是指加热离子注

感谢IT之家网友沐天的线索投递！，华为MateBook13si7版笔记本将于3月14日00:00正式开售，该机搭载i

2023年两会正式闭幕，两会政府工作报告对今年经济工作作出了高屋建瓴的部署和安排。政府工作报告提出，今年要大力提振市

，你们心心念念的YOGAPro14s2023款外观终于公布了，而且还是全新配色——日光映潮。据介绍，这款机型采用“s

闻静《科学焦点》编辑部近日，美国罗切斯特大学助理教授RangaP.Dias宣布在1万个大气压下实现了“镥-氢-氮

感谢IT之家网友goodfull的线索投递！，本源量子又一国产量子计算机科普展厅近日在北京中关村建成，该展厅将为公众

，微软今天发布了一则更新指南，较为详细地介绍了从Win10系统升级到Win11系统之后，如何恢复家庭功能设置。该指南

建银国际发布研究报告称，维持对360数科跑赢大盘的评级，给予目标价28美元，距17.47美元的现价涨幅达60%。报告

感谢IT之家网友逆时的声音的线索投递！，根据国际数据公司IDC全球季度企业客户端设备跟踪报告，2022年，瘦客户机设

，昂达现已推出新款B450S-W主板，可兼容AMDAM4插槽锐龙1-5代及速龙系列处理器，售价429元。据官方介绍，