算法技术

1. 什么是GPT
ChatGPT里面有两个词，一个是Chat，指的是可以对话聊天。另外一个词，就是GPT。

GPT的全称，是Generative Pre-Trained Transformer（生成式预训练Transfomer模型）。

可以看到里面一共3个单词，Generative生成式、Pre-Trained预训练、和Transformer。

有读者可能会注意到，我上面没有给Transformer翻译中文。

因为Transformer是一个技术专有名词，如果硬翻译 ，就是变压器。但是会容易失去本意，还不如不翻译。

在下面第3章节会再讲解一下Transformer。

2、GPT之技术演进时间线
GPT从开始至今，其发展历程如下：

2017年6月，Google发布论文《Attention is all you need》，首次提出Transformer模型，成为GPT发展的基础。 论文地址： https://arxiv.org/abs/1706.03762

2018年6月,OpenAI 发布论文《Improving Language Understanding by Generative Pre-Training》(通过生成式预训练提升语言理解能力)，首次提出GPT模型(Generative Pre-Training)。论文地址： https://paperswithcode.com/method/gpt 。

2019年2月，OpenAI 发布论文《Language Models are Unsupervised Multitask Learners》（语言模型应该是一个无监督多任务学习者），提出GPT-2模型。论文地址: https://paperswithcode.com/method/gpt-2

2020年5月，OpenAI 发布论文《Language Models are Few-Shot Learners》(语言模型应该是一个少量样本(few-shot)学习者，提出GPT-3模型。论文地址： https://paperswithcode.com/method/gpt-3

2022年2月底，OpenAI 发布论文《Training language models to follow instructions with human feedback》（使用人类反馈指令流来训练语言模型），公布Instruction GPT模型。论文地址： https://arxiv.org/abs/2203.02155

2022年11月30日，OpenAI推出ChatGPT模型，并提供试用，全网火爆。见：AI-001-火爆全网的聊天机器人ChatGPT能做什么