GPT现状终于有人讲清楚了！OpenAI大牛最新演讲爆火，还得是马斯克钦点的天才

2023-05-29 14:46:30 来源：华尔街见闻

继Windows Copilot发布后，微软Build大会热度又被一场演讲引爆。

前特斯拉AI总监Andrej Karpathy在演讲中认为思维树（tree of thoughts）与AlphaGo的蒙特卡洛树搜索（MCTS）有异曲同工之妙！

(相关资料图)

网友高呼：这是关于如何使用大语言模型和GPT-4模型的最详尽有趣的指南！

此外Karpathy透露，由于训练和数据的扩展，LLAMA 65B“明显比GPT-3 175B更强大”，并介绍了大模型匿名竞技场ChatBot Arena:

Claude得分介于ChatGPT 3.5和ChatGPT 4之间。

网友表示，Karpathy的演讲一向很棒，而这次的内容也一如既往没有令大家失望。

随着演讲而爆火的，还有推特网友根据演讲整理的一份笔记，足足有31条，目前转赞量已超过3000+：

所以，这段备受关注的演讲，具体提到了哪些内容呢？

如何训练GPT助手？

Karpathy这次的演讲主要分为两个部分。

第一部分，他讲了如何训练一个“GPT助手”。

Karpathy主要讲述了AI助手的四个训练阶段：预训练（pre-training）、监督微调（supervised fine tuning）、奖励建模（reward modeling）和强化学习（reinforcement learning）。

每一个阶段都需要一个数据集。

在预训练阶段，需要动用大量的计算资源，收集大量的数据集。在大量无监督的数据集上训练出一个基础模型。

Karpathy用了更多例子作补充：

使用较小的有监督数据集，通过监督学习对这个基础模型进行微调，就能创建一个能够回答问题的助手模型。

他还展示了一些模型的进化过程，相信很多人之前已经看过上面这张“进化树”的图了。

Karpathy认为目前最好的开源模型是Meta的LLaMA系列（因为OpenAI没有开源任何关于GPT-4的内容）。

在这里需要明确指出的是，基础模型不是助手模型。

虽然基础模型可以回答问题，但它所给出的回答并不可靠，可用于回答问题的是助手模型。在基础模型上进行训练的助手模型，通过监督微调，在生成回复和理解文本结构方面的表现将优于基础模型。

在训练语言模型时，强化学习是另一个关键的过程。

通过用人工标记的高质量的数据进行训练，可以使用奖励建模来创建一个损失函数，以改善其性能。然后，通过增加正向的标记，并降低负面标记的概率，来进行强化训练。

而在具有创造性的任务中，利用人类的判断力对于改进AI模型至关重要，加入人类的反馈可以更有效地训练模型。

经过人类反馈的强化学习后，就可以得到一个RLHF模型了。

模型训练好了，接下来就是如何有效利用这些模型解决问题了。

如何更好地使用模型？

在第二部分，Karpathy主要讨论了提示策略、微调、快速发展的工具生态系统以及未来的扩展等问题。

Karpathy又给出了具体示例来说明：

当我们在写文章时候，我们会进行很多的心理活动，需要考虑自己的表述是否正确。而对于GPT来说，这只是一个序列标记（a sequence of tokens）。

而提示（prompt）可以弥补这种认知差异。

Karpathy进一步解释了思维链提示的工作方式。

对于推理问题，要想让自然语言处理中Transformer的表现更好，需要让它一步一步地处理信息，而不能直接抛给它一个非常复杂的问题。

如果你给它几个例子，它会模仿这个例子的模版，最终生成的结果会更好。

模型只能按照它的序列来回答问题，如果它生成的内容是错误的，你可以进行提示，让它重新生成。

如果你不要求它检查，它自己是不会检查的。

这就涉及到了System1和System2的问题。

诺贝尔经济学奖得主丹尼尔卡尼曼在《思考快与慢》中提出，人的认知系统包含System1和System2两个子系统。System1主要靠直觉，而System2是逻辑分析系统。

通俗来说，System1是一个快速自动生成的过程，而System2是经过深思熟虑的部分。

这在最近一篇挺火的论文“Tree of thought”（思维树）中也有被提及。

深思熟虑指的是，不是简单的给出问题的答案，而更像是与Python胶水代码一起使用的prompt，将许多prompt串联在一起。模型必须要维护多个提示，还必须要执行一些树搜索算法，来找出要扩展的提示。

Karpathy认为这种思路与AlphaGo非常相似：

AlphaGo在下围棋时，需要考虑下一枚棋子下在哪里。最初它是靠模仿人类来学习的。
但除此之外，它还进行了蒙特卡洛树搜索，可以得到具有多种可能性的策略。它可以对多种可能的下法进行评估，仅保留那些较好的策略。我认为这在某种程度上相当于AlphaGo。

对此，Karpathy还提到了AutoGPT：

我认为目前它的效果还不是很好，我不建议大家进行实际应用。我只是认为，随着时间的推移，我们或许可以从它的发展思路中汲取灵感。

其次，还有一个小妙招是检索增强生成（retrieval agumented generation）和有效提示。

窗口上下文的内容就是transformers在运行时的记忆（working memory），如果你可以将与任务相关的信息加入到上下文中，那么它的表现就会非常好，因为它可以立即访问这些信息。

简而言之，就是可以为相关数据建立索引让模型可以高效访问。

如果Transformers也有可参考的主要文件，它的表现会更好。

最后，Karpathy简单讲了一下在大语言模型中的约束提示（Constraint prompting）和微调。可以通过约束提示和微调来改进大语言模型。约束提示在大语言模型的输出中强制执行模板，而微调则调整模型的权重以提高性能。

我建议在低风险的应用中使用大语言模型，始终将它们与人工监督相结合，将它们看作是灵感和建议的来源，考虑copilots而不是让它们完全自主代理。

关于Andrej Karpathy

Andrej Karpathy博士毕业后的第一份工作，是在OpenAI研究计算机视觉。

后来OpenAI联合创始人之一的马斯克看上了Karpathy，把人挖到了特斯拉。但也因为这件事，马斯克和OpenAI彻底闹翻，最后还被踢出局。在特斯拉，Karpathy是Autopilot、FSD等项目的负责人。

今年二月份，在离开特斯拉7个月后，Karpathy再次加入了OpenAI。

最近他发推特表示，目前对开源大语言模型生态系统的发展饶有兴趣，有点像早期寒武纪爆发的迹象。

传送门：[1]https://www.youtube.com/watch?v=xO73EUwSegU（演讲视频）[2]https://arxiv.org/pdf/2305.10601.pdf（“Treeof thought”论文）

参考链接：[1]https://twitter.com/altryne/status/1661236778458832896[2]https://www.reddit.com/r/MachineLearning/comments/13qrtek/n_state_of_gpt_by_andrej_karpathy_in_msbuild_2023/[3]https://www.wisdominanutshell.academy/state-of-gpt/

本文来源：量子位，原文标题：《GPT现状终于有人讲清楚了！OpenAI大牛最新演讲爆火，还得是马斯克钦点的天才》

标签：

上一篇 : 【成都脑科】脑动脉硬化怎么办【排行榜前十脑科医院】

下一篇 : 最后一页

推荐阅读

GPT现状终于有人讲清楚了！OpenAI大牛最新演讲爆火，还得是马斯克钦点的天才

前特斯拉AI总监AndrejKarpathy在微软Build大会上的演讲爆红，对如何训练GPT进行了细致的技术分析。

05-29 14:46:30

【成都脑科】脑动脉硬化怎么办【排行榜前十脑科医院】

脑动脉硬化怎么办脑动脉硬化症主要表现为头痛眩晕、失眠健忘、肢体麻痹，可有情绪波动、喜怒无常、烦躁不安

05-29 13:53:11

甘咨询不超7.6亿元定增获深交所通过国泰君安建功

中国经济网北京5月29日讯甘咨询(000779 SZ)于昨日发布公告称，公司于5月26日收到深交所上市审核中心出具的

05-29 13:11:53

在16.7万公顷小麦即将成熟之际_天天简讯

“目前，河南焦作的16 7万公顷小麦正处于灌浆后期、籽粒形成的关键时期，在麦子即将成熟之际，焦作市投...

05-29 13:00:32

孙颖莎王楚钦王楚钦哭了

一、孙颖莎王楚钦5月29日消息，28日，2023年德班世乒赛落下帷幕，国乒包揽本次比赛全部冠军，共获得5金2银5

05-29 11:20:46

环球即时看！温氏股份(300498.SZ)：从数据上看，目前行业产能去化尚未充分，产能去化主要集中在中小规模参与者

格隆汇5月29日丨温氏股份近期组织多场路演活动，问答环节中，就“目前行业产能去化速度如何。若行业参与...

05-29 11:21:57

提升监管工作效能守护人民身体健康

日前，区人大常委会集体调研本区零售药店药品安全监管工作情况。座谈会上，与会人员听取了区市场监管局关于

05-29 10:24:48

外媒：特斯拉涉“大规模”数据泄露，含4000条“突然加速”投诉；AITO问界第十万辆车下线丨车市晚闻

据外媒报道，荷兰数据监管机构表示，特斯拉可能存在数据保护漏洞。

05-29 09:27:25

轮滑比赛原来可以这么有趣！|世界新消息

单轮茶壶、双轮转、天鹅蟹……5月27日至28日，在肥西县全民健身中心举行的安徽省“小米高飞”2023青少年...

05-29 08:45:58

环球快播：张馨予电影节服装_张馨予的电影

1、影视作品《一个人的北京》MV-女主角《青春进行时》饰珍妮（女主演）合作演员：井

05-29 07:58:25

世界简讯:中国女足两将齐首发凯尔特人女足夺得苏格兰杯赛冠军

凯尔特人女足以2-0的比分击败流浪者女足，获得苏格兰杯冠军

05-29 06:59:38

重庆市巴南区：密织“安全网”，“六个着力”让平安校园再升级

新华小学开展第十五个5 12防灾减灾日专题教育。学校工作千万条，校园安全第一条。校园安全关乎社会稳定，关

05-29 06:07:41

环球资讯：初中汇操比赛分组抽签流程

音频解说你们好，我是教育新闻网的客服熊熊，今天为大家说一下这个初中汇操比赛分组抽签流程相关的问题。初

05-29 04:12:28

阿扎尔和德容都是在2019年开始踢西甲联赛，阿扎...

阿扎尔和德容都是在2019年开始踢西甲联赛，阿扎尔转会皇马1 15亿欧元，德容转会巴萨8600万欧元，他们两个的

05-29 03:16:48

戴予桐当前焦点

来为大家解答以上的问题。戴予桐这个很多人还不知道,现在让我们一起来看看吧！1、小时候父母离异，自己是由

05-29 01:04:05

寿阳县美食节（寿阳年俗吃茶食）

当前大家对于寿阳年俗吃茶食都是颇为感兴趣的，大家都想要了解一下寿阳年俗吃茶食，那么小美也是在网络上收

05-28 23:16:08

金证股份复牌三个交易日总市值缩水45亿元公司发布异动公告

因筹划收购上海文华财经资讯股份有限公司（以下简称“文华财经”）事项，金证股份在5月10日开始停牌。停...

05-28 22:05:57

隆扬电子：2023年计划投资复合铜箔生产基地建设项目

隆扬电子近期在接受调研时表示，2023年，公司计划投资复合铜箔生产基地建设项目，打造另一具有可观前景的优

05-28 21:01:50

租赁合约临期 H&M三里屯太古里旗舰店将于6月11日闭店

观点网讯。5月28日，据北京商报报道，由于租赁合约到期，H&M北京三里屯门店将于2023年6月11日正式闭店，并

05-28 20:04:45

“鬼城”再添一座？房价从2万跌到5千,如今还是无人问津？

“鬼城”再添一座？房价从2万跌到5千,如今还是无人问津？,鬼城,炒房客,一线城市,房价下跌

05-28 18:57:44

世界热议:诺基亚n81自带铃声_诺基亚N81自制主题

想必现在有很多小伙伴对于诺基亚N81自制主题方面的知识都比较想要了解，那么今天小好小编就为大家收集了一

05-28 17:51:09

第76届戛纳国际电影节落幕

第76届戛纳国际电影节落幕

05-28 17:12:50

车企淘汰赛，超半数品牌将“关转停”

在去年举行的第八届中国电动汽车百人会论坛上，长安汽车掌门人朱华荣曾公开表示，随着新能源汽车占有率的不

05-28 16:04:01

天天观速讯丨期货指数交易平台_期货指数是什么意思

1、股票指数期货简称股指期货。2、股指期货就是将某一股票指数视为一特定的、独立的交易品种。3、开设其对

05-28 14:56:10

官方售价24.95万元起新款奔驰长轴距A级上市

近日，我们从官方渠道获悉，新款奔驰长轴距A级轿车现已正式上市，共推出3款车型，官方售价24 95-27 22万元

05-28 13:07:13

拉姆飞行考试怎么考_拉姆飞行考试即时

1、可以去摩登码头，别的干不了什么了啊~可以去摩登码头没了没了没有啊，只能到攀登码头。2、或者听传言超

05-28 12:15:58

宁夏聚力新兴产业推动经济转型|快资讯

宁夏聚力新兴产业推动经济转型---经济日报银川5月27日讯（记者拓兆兵、许凌）宁夏近年来积极推动产业转型升

05-28 11:15:13

【世界独家】马斯克又在股东大会上“画饼”了？

一直以来，新车进展都是外界最关注的问题，但在今年的股东大会上，马斯克对特斯拉正在研发的两款新车，并未

05-28 10:08:22

观点：夏季达沃斯论坛期间将举办多场经贸活动利用国际化高端平台推动合作

天津北方网讯：记者从市政府新闻办近日召开的第十四届新领军者年会（夏季达沃斯论坛）媒体吹风会上获悉，我

05-28 09:23:47

最新快讯!气质小清新网名_气质小清新网名有哪些

欢迎观看本篇文章，小升来为大家解答以上问题。气质小清新网名，气质小清新网名有哪些很多人还不知道，现在

05-28 08:18:50

古琴与陶渊明的风度

原标题：古琴与陶渊明的风度图一关于陶渊明与古琴的关系，“不解音声，而蓄素琴一张，无弦，每有酒适，...

05-28 07:18:43

官方：巴黎圣日耳曼在中国香港开设青训学院环球快资讯

官方：巴黎圣日耳曼在中国香港开设青训学院,足球,大巴黎,psg,青训学院,中国香港,巴黎圣日耳曼

05-28 06:24:19

浑圆桩练法与功效（浑圆桩）环球热消息

1、经常站浑圆桩，对养生有一定的效果的。2、我国传统医学认为阴阳和调则百病不生,阴盛阳衰则机体失调,阴沉

05-28 04:20:31

世界今头条！新迈腾样车曝光，前脸内饰大幅调整，质感暴涨，丐版换1.5T引擎

新迈腾样车曝光，前脸内饰大幅调整，质感暴涨，丐版换1 5T引擎雅阁以及君越都已经完成换代，两款车都算不上

05-28 03:21:18

花美男之吻天天微动态

1、《花美男之吻》，是一本漫画名称，漫画作者优木那智。2、漫画别名：kissme公关部，优木那智的著名少女漫

05-28 00:53:58

肺结核传染有什么症状表现_被肺结核传染有什么症状

1、一般会出现肺结核中毒的症状，如低烧、乏力、盗汗、消瘦等。并会出现呼吸道症状，如咳嗽、咳痰、胸痛、

05-27 22:56:20

定边县白湾子镇学校

1、白湾子镇学校始建于1969年7月，是一所服务于邻近四个乡镇二万多群众子女的初中教育及本乡镇适龄儿童少年

05-27 21:54:02

电脑屏幕锁屏怎么设置密码_屏幕锁屏怎么设置密码

1、进入设置-常规-安全服务-屏幕锁定，选择锁屏方式，再设置密码即可哈。2、采纳一下,谢谢。本文到此分享完

05-27 20:53:42

世界动态:长沙边山社区开展“倡导婚育新风、促进家庭健康”主题活动

健康知识讲座。开展创建国家卫生城市大扫除活动。健康促进知识讲座及基本急救实操。5月26日，在中国计生协

05-27 19:58:07

白桃树的种植方法（白桃树苗）

1、土壤：土壤是桃树养殖的首要条件。桃树喜肥沃且通透性好、呈中性的沙质壤土，如果是在重盐碱的土壤栽植

05-27 18:39:08

汉川：反哺桑梓，乡贤有话说世界要闻

汉川：反哺桑梓，乡贤有话说---“前山村是汉川市共同缔造的试点村，作为前山村的一份子，也是村乡贤会的...

05-27 17:47:25

Vidda再发三款新品！三色激光行业前景潜力无限！

其中，zui让我心动的莫过于这个ViddaC1Pro，它不仅颜值非常高，而且性能也特别强，真就在万元内打遍天下无

05-27 16:50:06

世界快看：大学生轻资产创业首选项目

共享wifi贴轻资创业神奇的模式，顾客扫码连wifi就能赚取收益。共享wifi贴码推广代理怎么做已经是当下最热门

05-27 15:52:49

北京新增10万小客车指标，普通指标额度由去年的4万个调减为3万个

今天下午，北京市小客车指标调控管理办公室发布《关于2022年小客车指标总量和配置比例的通告》。明年，北京

05-27 15:08:12

全球热文：渤海湾首个千亿方大气田中心平台建造完成

中国海洋石油集团有限公司26日宣布，渤海湾首个千亿方大气田——渤中19-6凝析气田中心平台在青岛建造完...

05-27 13:51:07

nba2k20转身过人按键_nba2k怎么转身过人|每日看点

1、NBA2KOnline各种动作打法键盘操作大全梦幻舞步:关键键W+方向键+轻点投篮键D+投篮键D转

05-27 12:52:30

网络中的内涵是什么意思_内涵网络意思是什么简介介绍

对于内涵网络意思是什么这个问题感兴趣的朋友应该很多，这个也是目前大家比较关注的问题，那么下面小好小编

05-27 11:57:55

铜金主业稳步成长，矿业龙头持续扩张环球百事通

紫金矿业(601899)投资要点：矿业龙头，布局全球。紫金矿业是大型跨国矿业集团，主要在全球范围内从事铜、金

05-27 10:53:22

展现品牌悦己新思维，谭本宏：希望成为用户真实有趣的挚友

随着消费者自我意识的进一步提升，追求自由的户外运动成为一种流行的生活方式，运动场景的边界感也逐渐被打

05-27 09:43:24

积分365

本文内容是由小编为大家搜集关于积分365，以及的资料,整理后发布的内容，让我们赶快一起来看一下吧！抱歉，

05-27 08:51:48

精彩推送

【成都脑科】脑动脉硬化怎么办【排行榜前十脑科医院】

甘咨询不超7.6亿元定增获深交所通过国泰君安建功

在16.7万公顷小麦即将成熟之际_天天简讯

孙颖莎王楚钦王楚钦哭了

环球即时看！温氏股份(300498.SZ)：从数据上看，目前行业产能去化尚未充分，产能去化主要集中在中小规模参与者

提升监管工作效能守护人民身体健康

外媒：特斯拉涉“大规模”数据泄露，含4000条“突然加速”投诉；AITO问界第十万辆车下线丨车市晚闻

轮滑比赛原来可以这么有趣！|世界新消息

环球快播：张馨予电影节服装_张馨予的电影

世界简讯:中国女足两将齐首发凯尔特人女足夺得苏格兰杯赛冠军

重庆市巴南区：密织“安全网”，“六个着力”让平安校园再升级

环球资讯：初中汇操比赛分组抽签流程

阿扎尔和德容都是在2019年开始踢西甲联赛，阿扎...

戴予桐当前焦点

寿阳县美食节（寿阳年俗吃茶食）

金证股份复牌三个交易日总市值缩水45亿元公司发布异动公告

隆扬电子：2023年计划投资复合铜箔生产基地建设项目

租赁合约临期 H&M三里屯太古里旗舰店将于6月11日闭店

“鬼城”再添一座？房价从2万跌到5千,如今还是无人问津？

世界热议:诺基亚n81自带铃声_诺基亚N81自制主题

第76届戛纳国际电影节落幕

车企淘汰赛，超半数品牌将“关转停”

天天观速讯丨期货指数交易平台_期货指数是什么意思

官方售价24.95万元起新款奔驰长轴距A级上市

拉姆飞行考试怎么考_拉姆飞行考试即时

宁夏聚力新兴产业推动经济转型|快资讯

【世界独家】马斯克又在股东大会上“画饼”了？

观点：夏季达沃斯论坛期间将举办多场经贸活动利用国际化高端平台推动合作

最新快讯!气质小清新网名_气质小清新网名有哪些

古琴与陶渊明的风度

官方：巴黎圣日耳曼在中国香港开设青训学院环球快资讯

浑圆桩练法与功效（浑圆桩）环球热消息

世界今头条！新迈腾样车曝光，前脸内饰大幅调整，质感暴涨，丐版换1.5T引擎

花美男之吻天天微动态

肺结核传染有什么症状表现_被肺结核传染有什么症状

定边县白湾子镇学校

电脑屏幕锁屏怎么设置密码_屏幕锁屏怎么设置密码

世界动态:长沙边山社区开展“倡导婚育新风、促进家庭健康”主题活动

白桃树的种植方法（白桃树苗）

汉川：反哺桑梓，乡贤有话说世界要闻

Vidda再发三款新品！三色激光行业前景潜力无限！

世界快看：大学生轻资产创业首选项目

北京新增10万小客车指标，普通指标额度由去年的4万个调减为3万个

全球热文：渤海湾首个千亿方大气田中心平台建造完成

nba2k20转身过人按键_nba2k怎么转身过人|每日看点

网络中的内涵是什么意思_内涵网络意思是什么简介介绍

铜金主业稳步成长，矿业龙头持续扩张环球百事通

展现品牌悦己新思维，谭本宏：希望成为用户真实有趣的挚友

积分365

穆勒：克洛普都说紧张球员肯定也紧张，我寄希望于多特因压力失误

X 广告

资讯

行业动态

企业动态

畜牧科技

家禽技术

特种养殖