GPT-3

生成型预训练变换模型 3
Generative Pre-trained Transformer 3（GPT-3）
原作者	OpenAI
首次发布	2020年6月11日，4年前 (beta)
当前版本	2023年2月13日，2年前
源代码库	https://github.com/openai/gpt-3
前任	GPT-2
繼任	GPT-4
类型	大型语言模型; 基于转换器的生成式预训练模型; 基礎模型;
许可协议	专有
网站	openai.com/blog/openai-api

生成型预训练變換模型 3 （英語：Generative Pre-trained Transformer 3，簡稱 GPT-3）是一個自迴歸語言模型，目的是為了使用深度學習生成人類可以理解的自然語言^[1]。GPT-3是由在舊金山的人工智能公司OpenAI訓練與開發，模型設計基於谷歌開發的 Transformer 語言模型。GPT-3的神經網路包含1750億個參數，需要700GB来存储^[2]。该模型在许多任务上展示了强大的零样本和少样本的能力^[3]。

事实速览 原作者, 首次发布 ...

关闭

OpenAI於2020年5月發表GPT-3的論文，在次月為少量公司與開發人團釋出應用程式介面的測試版。微軟在2020年9月22日宣布取得了GPT-3的獨家授權^[4]。

GPT-3被認為可寫出人類無法與電腦區別的文章與字串，GPT-3原始論文的作者们警告了GPT-3有可能對於社會的負面影響，比如利用製造假新聞的可能性。英國《衛報》即使用GPT-3生成了一個關於人工智慧对人类无威胁的評論專欄^[5]。李開復稱卷積神經網路與GPT-3為人工智能重要的改善，两者皆是模型加海量数据的成果^[6]。

[1]

[2]

[3]

[4]

[5]

[6]

GPT-3

背景

训练和能力

迭代版本

GPT-3.5

GPT-3.5 Turbo

参见

參考資料

外部链接

Wikiwand - on