关于Chatgpt的一篇演讲稿

来源#

本来是要在班里演讲，因为期末考试被迫停止 QAQ
留个纪念（

正文#

有人说，2023 年是人工智能元年。因为 OpenAI 公司在 2022 年 11 月 30 日公开发布了 ChatGPT。从此，人们得以通过与 ChatGPT 对话的形式，直接了解到人工智能带给我们的便利。而如今已是 2024 年，相信大家对 Chatgpt 都有了或多或少的了解，或是从网络媒体的报道，或是从语文作文，抑或是从英语阅读中。但大家是否想对其有更深入一点的理解呢？今天就让我们从 chatgpt 出发，了解其背后的原理，在进一步去探索一下背后的神经网络的基本模式。

让我们先从 Chatgpt 的名称开始说起吧。Chatgpt 全称：Chat Generative Pre-trained Transformer，意为生成式预训练 Transformer。生成式，即指 Chatgpt 是一个用来生成新文本的机器人。“预训练”，指模型经历了从大量数据中学习的过程。而关键是最后一个词，transformer，这是什么？其实他是一种特殊的一种深度学习模型，一个神经网络。是 Google 在 2017 年发布的一篇论文《Attention Is All You Need》中提出的一个架构。Chatgpt 就是基于 Transformer 模型进一步修改得来的。

那么深度学习是什么意思呢？深度学习是机器学习的一种，而机器学习采用数据驱动，反馈到模型参数，指导模型行为。可能有点难懂啊。这里的模型，其就是一个广义上的函数，即映射。而神经网络指的是这个函数内部的实现方式。一会会介绍。继续说机器学习。比如说，一个可以给图片加标签的函数，fx，输入 x 是图片，而输出 fx 即为标签。机器学习的核心理念就是，不要在代码中定义任何行为，而是去构造一个有可调参数的灵活函数，然后拿着大量的例子，去让机器调整各个参数，以模仿这种表现。其实有点像数学里的待定系数法。

了解了 Transformer 模型，我们再来看简单地看一下 Chatgpt 的原理。如果用一句话去概括，就是：以前面所有的文本为基础，预测出现频率最高的下一个词，来实现文本生成的。其实有点像搜索引擎的自动补全，我们每输入一个词，输入框就开始预测后面的文本，概率越高的排在越上面。但模型是如何的到每个词出现的概率的呢？

这就提到了上面所说的 Transformer 架构了。上面说到了，其实 Transformer 就是一个函数。如果拿 f (x) 举例，他的输入值 x，即为前面所有的文本，输出值即为每一个词的概率。我们都知道，函数，例如二次函数 f (x) = ax^2+bx+c，abc 就是这个函数的参数，对于这个函数来说，参数数量是 3。那么，我们自然想问，对于 ChatGpt 的修改后的 Transformer 架构，他的参数数量是多少呢？大家可以猜一猜。答案是 1750 亿个。

为什么会有这么多参数，又如何让机器去调整呢？下面，我们用一个简单一点的例子，数字识别来理解一下神经网络。就是这个函数的内部实现机制。

首先，我们必须承认一个事实，其实让计算机识别数字是很困难的。你的 3 和我的 3 可能大相径庭。科学家们发明出了一套神奇的东西，即神经网络去解决这个问题。

顾名思义，神经网络来源于人的大脑结构。神经中，最重要的就是神经元和神经元的连接方式。神经元可以理解为装有数字的容器，装着从 0—1 的数字，称为激活值。对于识别数字这个任务来说，输入的每一个神经元对应了图上的每一个像素的颜色深浅。拿 28 像素 x28 像素的图像举例，输入的神经元就有 784 个，构成了神经网络的第一层。接着跳到最后一层，有十个神经元，代表 0—9 十个数字，他们的激活值也在 0—1 之间。这些值代表系统认为输入的图像对应此数字的可能性。网络中间还有隐含层，里面进行处理识别数字的具体工作。

神经网络运行时候，上一层的激活值决定了下一层的激活值。所以说，神经网络的核心就是上一层的激活值如何算出下一层的激活值。其实，设计出的神经网络想要模仿生物的神经系统，某些神经元的激发，会导致其他神经元激发。

第一层的激活值会算出第二层每个神经元的激活值，依次往下，直到最后，输出层里面最亮的就是神经系统的选择。所以为什么要分层？我们其实期待每一层可以特异性识别某些特征。。。每一层的激活值如何算出下一层的激活值靠的就是 “参数”，比如第一层 784 个神经元的激活值是 a1,a2,a3,…,a784。那么假设第二层有 16 个神经元，每一个 bi，要想由第一层算出来，就要 784 的参数，例如 b1=w1*a1+w2*a2+…+w784*a784。一开始这些值都是随机的，也别指望电脑能识别出什么东西。我们要做的就是拿出大量的已经写好的数字图片，和对应的数字，每次都 “投喂” 给电脑，并算出电脑做的有多 “差”—— 代价函数，并给出修改参数的 “意见”—— 代价函数的负梯度。经过一次的修改，这些参数一次次的调整，之后遇到新的图片，神经网络也可以应付了。

其实，对于我们日常学习来说，有何尝不是如此呢。及时对自己表现评估。找到最 “高效” 的提升方法加上大量练习，就会一定会自己学习得更好。+ 补充写一些 QAQ