GPT现状终于有人讲清楚了！OpenAI大牛最新演讲爆火，还得是马斯克钦点的天才_互联网思维

互联网思维

GPT现状终于有人讲清楚了！OpenAI大牛最新演讲爆火，还得是马斯克钦点的天才

珠江路在线　 2023年5月31日　【转载】泡泡影视　

继Windows Copilot公布后，微软Build大会热度又被一场报告引爆。

前特斯拉AI总监Andrej Karpathy在报告中认为思维树(tree of thoughts)与AlphaGo的蒙特卡洛树查找(MCTS)有殊途同归之妙！

网友高呼：这是关于如何使用大语言模型和GPT-4模型的最详尽乏味的指南！

为什么F越大光圈越小，F22.84等数字怎样计算？	快看你手机里有没有？这35款App被点名偷偷收集个人信息
太占CPU电脑太卡？教你关闭Win11内存压缩	root是什么意思 root权限获取

此外Karpathy 透露，因为训练和数据的扩充，LLAMA 65B“显而易见比GPT-3 175B更壮大”，并介绍了大模型匿名竞技场ChatBot Arena：

Claude得分介于ChatGPT 3.5和ChatGPT 4中间。

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

网友示意，Karpathy的报告一贯很棒，而这次的内容也判若两人没有令大家绝望。

随着报告而爆火的，还有推特网友依据报告整顿的一份笔记，足足有31条，当前转赞量已超过3000+：

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

所以，这段备受关注的报告，具体提到了哪些内容呢？

国产半导体路在何方，瓦森纳与光刻机你了解多少	Win7待机不断网在空闲时不让其断网的设置方法
新东方已“躺平”，教培百万从业者都去哪了？	2022年内存市场将供过于求：价格或下跌20%

如何训练GPT帮手？

Karpathy这次的报告重要分为两个部分。

第一部分，他讲了如何训练一个“GPT帮手” 。

Karpathy重要讲述了AI帮手的四个训练阶段：

预训练(pre-training)、监督微调(supervised fine tuning)、嘉奖建模(reward modeling)和强化学习(reinforcement learning) 。

天才曲高和寡！90年代的4大失败超前科技产品，太先进也有错？	被误解到层层伪装的5G天线——心里有苦说不出
最后一个风口：互联网殡葬	揭秘简单易学的长时间曝光拍摄技巧

每一个阶段都需求一个数据集。

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

在预训练阶段，需求动用大量的计算资源，收集大量的数据集。在大量无监督的数据集上训练出一个根底模型。

Karpathy用了更多例子作补充：

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

接下来进入微调阶段。

使用较小的有监督数据集，通过监督学习对这个根底模型进行微调，就能创立一个能够答复问题的帮手模型。

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

他还展示了一些模型的进化过程，相信众多人之前已经看过上面这张“进化树”的图了。

win10系统下安装win10/win8.1双系统的步骤	再造一个台积电需要多少钱：5年，1万亿！
电脑开机龟速仅需一个设置 5秒进入系统桌面	避开“慢门摄影”的 6 个误区

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

Karpathy认为当前最好的开源模型是Meta的LLaMA系列(因为OpenAI没有开源任何关于GPT-4的内容) 。

在这里需求明确指出的是，根底模型不是帮手模型。

固然根底模型能够答复问题，但它所给出的答复并不牢靠，可用于答复问题的是帮手模型。在根底模型上进行训练的帮手模型，通过监督微调，在生成回复和了解文本构造方面的体现将优于根底模型。

在训练语言模型时，强化学习是另一个要害的过程。

通过用人工标记的高品质的数据进行训练，能够使用嘉奖建模来创立一个损失函数，以改善其性能。而后，通过添加正向的标记，并减低负面标记的概率，来进行强化训练。

而在存在制造性的使命中，利用人类的推断力关于改良AI模型至关重要，加入人类的反馈能够更有效地训练模型。

通过人类反馈的强化学习后，就能够得到一个RLHF模型了。

模型训练好了，接下来便是如何有效利用这些模型解决问题了。

如何更好地使用模型？

在第二部分，Karpathy重要探讨了揭示策略、微调、快捷进展的工具生态系统以及将来的扩充等问题。

Karpathy又给出了具体示例来注明：

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

当我们在写文章时候，我们会进行众多的心理运动，需求考量自己的表述是不是正确。而关于GPT来说，这只不过一个序列标记(a sequence of tokens) 。

而揭示(prompt) 能够补偿这种认知差别。

Karpathy进一步解释了思维链揭示的工作模式。

关于推理问题，要想让自然语言解决中Transformer的体现更好，需求让它一步一步地解决信息，而不能直接抛给它一个十分复杂的问题。

假如你给它几个例子，它会摹仿这个例子的模版，最平生成的后果会更好。

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

模型不得不依照它的序列来答复问题，假如它生成的内容是舛误的，你能够进行揭示，让它再一次生成。

假如你不要求它审查，它自己是不会审查的。

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

这就波及到了System1和System2的问题。

诺贝尔经济学奖得主丹尼尔卡尼曼在《思量快与慢》中提出，人的认知系统包括System1和System2两个子系统。System1重要靠直觉，而System2是逻辑综合系统。

通俗来说，System1是一个快捷自动生成的过程，而System2是通过深谋远虑的部分。

这在近期一篇挺火的论文“Tree of thought”(思维树)中也有被提及。

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

深谋远虑指的是，不是容易的给出问题的答案，而更像是与Python胶水代码一同使用的prompt，将许多prompt串联在一同。模型必须要保护多个揭示，还必须要执行一些树查找算法，来找出要扩充的揭示。

Karpathy认为这种思路与AlphaGo十分类似：

AlphaGo在下围棋时，需求考量下一枚棋子下在哪里。最初它是靠摹仿人类来学习的。

但除此之外，它还进行了蒙特卡洛树查找，能够得到存在多种可能性的策略。它能够对多种可能的下法进行评估，仅保留那些较好的策略。我认为这在某种程度上相当于AlphaGo 。

对此，Karpathy还提到了AutoGPT：

我认为当前它的动机还不是很好，我不提议大家进行实际利用。我只不过认为，随着工夫的推移，我们兴许能够从它的进展思路中吸收灵感。

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

其次，还有一个小妙招是检索加强生成(retrieval agumented generation)和有效揭示。

窗口上下文的内容便是transformers在运行时的记忆(working memory)，假如你能够将与使命有关的信息加入到上下文中，那么它的体现就会十分好，因为它能够马上拜访这些信息。

简而言之，便是可认为有关数据构建索引让模型能够高效拜访。

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

假如Transformers也有可参考的重要文件，它的体现会更好。

最终，Karpathy 容易讲了一下在大语言模型中的束缚揭示(Constraint prompting)和微调。

能够通过束缚揭示和微调来改良大语言模型。束缚揭示在大语言模型的输出中强制执行模板，而微调则调整模型的权重以遍及性能。

我提议在低风险的利用中使用大语言模型，始终将它们与人工监督相联合，将它们看作是灵感和提议的起源，考量copilots而不是让它们彻底自主代理。

关于Andrej Karpathy

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

Andrej Karpathy博士毕业后的第一份工作，是在OpenAI探究计算机视觉。

后来OpenAI联合独创人之一的马斯克看上了Karpathy，把人挖到了特斯拉。但也因为这件事，马斯克和OpenAI彻底闹翻，最终还被踢出局。在特斯拉，Karpathy是Autopilot、FSD等项目标负责人。

今年二月份，在离开特斯拉7个月后，Karpathy再次加入了OpenAI 。

近期他发推特示意，当前对开源大语言模型生态系统的进展饶感兴趣，有点像早期寒武纪迸发的迹象。

GPT现状终于有人讲清晰了！OpenAI大牛最新
报告爆火，还得是马斯克钦点的天才

免责声明：凡标注转载/编译字样内容并非本站原创，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。

　

按产品看新闻

·笔记本	·服务器	·平板电脑
·台式机	·游戏机	·无线路由器

·CPU	·内存	·固态硬盘
·主板	·显卡	·显示器

·手机	·数码相机	·镜头
·VR眼镜	·无人机	·数码摄像机

　相关资讯

头部团长售假被抓，快团团能装下拼多多的野心吗？

从财报拆解网易游戏：爆款不再、海外遇阻、技术难落地

领先几光年！NVIDIA CPU+GPU超级芯片终于量产：144TB内存

英伟达的市值几天涨一个AMD 这回我真成臭打游戏的了

索尼全新PS掌机Q将问世：10年没更新这条产品线了

为什么笔记本电池到60%就不再充电了

官方暗示《无人深空》游戏即将登陆 Mac 平台

HDD没人买 SSD跌破头硬盘大厂将再次裁员：最高2N+1补偿

热点图文

扫码用手机访问