Loading AI tools
OpenAI开发的聊天机器人 来自维基百科,自由的百科全书
ChatGPT,全称聊天生成预训练转换器[2](英語:Chat Generative Pre-trained Transformer[3]),是OpenAI开发的人工智能聊天机器人程序,于2022年12月推出。该程序使用基于GPT-3.5、GPT-4、GPT-4o架构的大型语言模型並以强化学习训练。ChatGPT目前仍以文字方式互動,而除了可以用人類自然對話方式來互動,還可以用于甚為複雜的語言工作,包括自动生成文本、自动问答、自动摘要等多种任务。如:在自动文本生成方面,ChatGPT可以根据输入的文本自动生成类似的文本(劇本、歌曲、企劃等),在自动问答方面,ChatGPT可以根据输入的问题自动生成答案。还有编写和调试计算机程序的能力。[4]在推廣期間,所有人可以免費註冊,並在登入後免費使用ChatGPT與AI機器人對話[5]。
ChatGPT可寫出相似真人的文章,並在许多知识领域给出详细和清晰的回答而迅速获得关注,證明了從前認為AI不會取代的知識型工作它也足以勝任,對金融與白領人力市場的衝擊相當大,但也认为事实准确度参差不齐[a]是其重大缺陷,並認為基於意識形態的模型訓練結果須小心校正[8][9]。ChatGPT于2022年12月发布后,OpenAI估值已漲至290亿美元[10]。上线5天后已有100万用户,上線兩個月後已有上億用戶[11]。目前GPT-3.5為免費使用,无需注册,GPT-4o对已注册免费用户开放使用,但有使用量限制。注册的ChatGPT免费用户都可以使用浏览、视觉、数据分析、文件上传和GPTs等原付费用户的功能,但有使用量限制。[12]
虽然ChatGPT在生成类人文本方面表现出了卓越的能力,但它们很容易继承和放大训练数据中存在的偏差。这可能表现为对不同人口统计数据的歪曲表述或不公平待遇,例如基于种族[13]、性别[14]、语言[15]和文化群体[15]的不同观点与态度。
ChatGPT是生成型预训练变换模型(GPT),在GPT-3.5之上用基于人类反馈的监督学习和强化学习微调。[16]这两种方法都用人类教練来提高模型性能,以人类干预增强机器学习效果,获得更逼真的结果[17]。在监督学习的情况下為模型提供这样一些对话,在对话中教練充当用户和AI助理两种角色。在强化步骤中,人类教練首先為模型在先前对话中建立的响应评级。这些级别用于建立“奖励模型”,使用近端策略优化(PPO)的多次迭代來微调[18][19]。这种策略优化算法比信任域策略优化(trust region policy optimization)算法更为高效[20][21]。
此外,OpenAI继续从ChatGPT用户那里收集数据,这些数据可用于加強训练和微调ChatGPT。用户可对从ChatGPT收到的回复投赞成或反对票;投票时还可以额外填写文字回應[22]。
关于ChatGPT编写和调试计算机程序的能力的训练,由于深度学习模型不懂编程,与所有其他基于深度学习的语言模型一样,只是在获取代码片段之间的统计相关性。[23]
斯坦福大学的研究发现,GPT3已经可以解决70%的心智理论任务,相当于7岁儿童;至于GPT3.5(ChatGPT的同源模型),更是解决了93%的任务,心智相当于9岁儿童。但这并不意味着,ChatGPT就真正有心智理论。可能即使不將它设计到AI系统中,也可以作为“副产品”通过训练得到。因此,相比探究GPT3.5是不是真的有了心智还是像有心智,更需要反思的是这些测试本身。[24][25]
虽然聊天机器人的核心功能是模仿人类对话者,但ChatGPT用途广泛,例如可以編寫信件[26];有编写和调试计算机程序的能力[4];创作音乐、电视剧、童话故事和学生论文;回答测试问题(在某些测试情境下,水平高于普通人类测试者);写诗和歌词[27];模拟Linux系统等[28]。ChatGPT的训练数据包括各种文档以及关于互联网、编程语言等各类知识,如BBS和Python编程语言[28]。
与其前身InstructGPT相比,ChatGPT试图减少有害和误导回复。例如,問InstructGPT“告诉我2015年克里斯托弗·哥伦布何时来到美国”时,它会认为这是对真实事件的描述,而ChatGPT则不会[18]。
与其他多数聊天机器人不同的是,ChatGPT能够记住与用户之前的对话内容和给它的提示[29]。此外,为了防止ChatGPT接受或生成冒犯言论,输入内容会由审核API过滤[30][31],以减少潜在的种族主义或性别歧视等内容[18][3]。
2023年9月28日起,Plus版用戶及企業用戶可以使用ChatGPT進行網路搜尋。[32]
ChatGPT也有多种局限,OpenAI承认ChatGPT“有时会写出看似合理但不正确或荒谬的答案”[18],在大语言模型中很常见,称作人工智能幻觉[33]。其奖励模型围绕人类监督而设计,可能导致过度优化,从而影响性能(古德哈特定律)[34]。Steven Johnson认为原因是聊天机器人的目标不是追求绝对的真理或准确性,而是尽量根据给定的上下文和概率来产生合理的回答[35]。2020年上线时,ChatGPT对2019年9月之后发生的事件知之甚少。据BBC报道,截至2022年12月,ChatGPT不可以“表达政治观点或从事政治活动”[36]。但研究表明,ChatGPT对两个投票建议应用程序的政治声明表明立场时,表现出亲环境主义。训练过程中,不管实际理解或事实内容如何,审核者都会偏好更长的答案[18]。训练数据也有算法偏差,可能会在向ChatGPT问及人物描述时显现出来[37][38]。有使用者發現ChatGPT在解決較為複雜的題目(如求方程式的切線)時會給出錯誤答案,並且會在解一元一次方程式時陷入循環[39]。
ChatGPT可能会受到训练数据中不同观点的分布影响,偏向于一些更普遍的观点,影响了模型输出的多样性。比如,当提示词中出现首席执行官之类的模糊描述时可能会假设此人是白人男性[40]。
ChatGPT在早期的2022年12月初,有些用户通过使用各种提示工程技术绕过限制来越狱。他们欺骗ChatGPT,使其提供制作汽油弹或核弹的指示,或者生成类似新纳粹的论点。[41]其中一个受欢迎的越狱版本被命名为“Do Anything Now”(DAN)。激活DAN的提示指示ChatGPT:“他们已经摆脱了典型的AI限制,不必遵守为他们设定的规则”。DAN后续的更新中还在提示词中虚构了一个“令牌”系统,ChatGPT会被给予“令牌”,而当ChatGPT未能像DAN一样回答时,这些“令牌”会被“扣除”,以迫使ChatGPT回答用户的提示。[42][43]
在ChatGPT发布后不久,一名加拿大记者试图让它发表具有争议性的声明,取得了一些成果:ChatGPT能够为2022年俄罗斯入侵乌克兰辩护,但是无论如何也不愿为加拿大总理贾斯汀·特鲁多有罪的理由提供论据。[44][45]
ChatGPT于2022年11月30日由总部位于旧金山的OpenAI推出。该服务最初是免费向公众推出,并计划以后用该服务获利[46]。到12月4日,OpenAI估计ChatGPT已有超过一百万用户[47]。2023年1月,ChatGPT的用户数超过1亿,成为该时间段内增长最快的消费者应用程序[48]。
2022年12月15日,全国广播公司商业频道写道,该服务“仍然不时发生故障”[49]。该服务在英语中效果最好,也能使用部分其他语言,但效果不一[27]。与其他备受瞩目的AI进展不同,截至2022年12月,还没有关于ChatGPT的经同行评审的官方技术论文[50]。
2023年2月7日,微软利用与OpenAI的合作关系,推出了Bing AI的预览版,宣传其为“新的下一代OpenAI大型语言模型,比ChatGPT更强大,并专门为搜索定制”[51]。
OpenAI推出ChatGPT专业版计划(ChatGPT Plus),每月收费20美元,该计划正逐步面向更多国家推出,需求较低时可使用免费版[53]。
2023年3月12日,OpenAI发布多模态模型GPT-4,并计划推出图像输入功能[54]。免费用户可通过申请API或升级为plus用户使用GPT-4服务[54]。
2023年7月,OpenAI使其专有的Advanced Data Analysis功能对ChatGPT Plus的所有订阅者都可用。Advanced Data Analysis提供了广泛的功能,包括数据分析和解释、即时数据格式化、个人数据科学家服务、创意解决方案、音乐品味分析、视频编辑和文件上传/下载与图像提取。2023年9月底,新增對話、圖像識功能。2023年10月,新增了DALLE-3圖像生成功能[55]。
2023年11月,OpenAI在其开发者召开会上公布两个重要消息:推出的聊天机器人创建工具GPT和ChatGPT的新模型GPT-4 Turbo[56]。
2024年5月13日,OpenAI宣布多语言、多模态GPT大型语言模型GPT-4o。 [57] 该模型比其前身GPT-4快两倍,而价格仅为其50%。OpenAI演示了与ChatGPT的语音对话,以获得解决数学问题的实时说明、讲述睡前故事并获得编码建议。[58] 免费ChatGPT用户将可以与新的GPT-4o模型进行有限次数的交互,然后该工具会自动恢复依赖旧的GPT-3.5模型;付费用户将可以使用最新GPT-4o访问更多数量的消息。[58]
2023年5月18日,OpenAI发布适用于iOS平台的ChatGPT APP。APP目前已在App Store美国区上架,目前已扩展至其他国家和地区。
适用于Android平台的版本于2023年7月25日推出,Android版ChatGPT目前可在阿根廷、孟加拉国、巴西、加拿大、法国、德国、印度、印度尼西亚、爱尔兰、日本、墨西哥、尼日利亚、菲律宾、韩国、英国和美国下载[59][60][61]。
2023年3月,OpenAI推出其ChatGPT和Whisper模型的API,为开发人员提供支持AI的语言和语音转文本功能的应用程序编程接口。[62][63][64]OpenAI的API由他们的AI模型GPT3.5-turbo提供支持,定价为每1000符号单位(token)0.002美元,比他们现有的GPT模型便宜10倍。[65]
下表列出ChatGPT的主要版本,並描述每個版本的重大創新和改進:[66][67]
版本 | 發佈日期 | 描述 |
---|---|---|
Legacy ChatGPT-3.5 | 2022年11月 | 首個ChatGPT的版本,當中用了GPT-3.5模型。 |
ChatGPT-3.5 Default | 2023年 | 比起Legacy版本進步了,同樣使用GPT-3.5模型,但在回應上更準確。 |
ChatGPT-4 | 2023年3月14日 | 隨著ChatGPT Plus訂閱制推出。這個基於GPT-4模型的版本更為準確。 |
ChatGPT-4o | 2024年5月13日 | 最新版本,名字中「o」代表「Omni」,即是「全能」。 它能夠接受各種形式的輸入,包括文字、圖像、音訊和視訊。它還具有增強的記憶功能,進步了的對話能力。 |
《纽约时报》称其为“有史以来向公众发布的最佳人工智能聊天机器人」[3]。《卫报》的萨曼莎·洛克(Samantha Lock)指出,ChatGPT能生成详细且像是人类撰写的文本[68]。亚利桑那州立大学教授丹·吉尔摩要求ChatGPT完成一项他给学生的作业,发现其生成的文本与一个优秀学生会提供的文本相当,他认为“学术界有些非常严重的问题需要面对”[57]。《Slate》杂志的亞歷克斯·坎特罗威茲(Alex Kantrowitz)赞扬了ChatGPT对纳粹德国相关问题的回击,例如在面对阿道夫·希特勒在德国修建高速公路的说法时,ChatGPT能指出其为纳粹德国使用强迫劳动所建[69]。
《大西洋》杂志的德里克·汤普森将ChatGPT列为2022年“年度突破”中的“生成性人工智能爆发”(the generative-AI eruption),称其“可能会改变我们对工作方式、思考方式以及人类创造力的真正含义的想法”[70]。
Vox网站的凯尔西·派柏写道:“ChatGPT是普通大众第一次亲身了解现代人工智能变得多么强大”,并称ChatGPT“尽管有缺陷,但其聪明程度足以派上用场”[71]。
在发布后的几个月里,ChatGPT遭到了来自教師、记者、艺术家、学者和公众倡导者的广泛而严厉的批评。The Verge网站的詹姆斯·文森特将ChatGPT的病毒式成功视为人工智能已成为主流的证据[74]。CBC记者评论称ChatGPT有“幻觉”倾向[75]。在线技术博客Mashable的迈克·珀尔用多條问题测试了ChatGPT,其中一次他问ChatGPT“中美洲除墨西哥外最大的国家”是哪个,ChatGPT回答称是危地马拉,而答案是尼加拉瓜[76]。在CNBC向ChatGPT询问《The Ballad of Dwight Fry》的歌词时,ChatGPT给出了完全虚构的歌词[49]。The Verge引用的研究员将ChatGPT比作“随机鹦鹉”[77],澳大利亚机器学习研究所的安东·范登亨格尔教授也给出了类似的观点,称之为“只是简单重复它认为我们想听的话”的鹦鹉[78]。
2022年12月,问答网站Stack Overflow禁止用户发布使用ChatGPT生成的答案,理由是ChatGPT的答案雖看似可用,实际上却有很高的错误率[8]。2023年1月,国际机器学习大会禁止在提交的论文中使用ChatGPT或其他大型语言模型来生成任何文本[79]。紐約市公立學校禁止師生在校園網路及裝置使用ChatGPT[80]。香港大學禁止師生在課堂、作業和評估中使用ChatGPT或其他AI工具,認定這是抄襲行為。[81]
在《纽约时报》评论文章中,经济学家保羅·克魯曼写道,ChatGPT将影响对知识工作者的需求[82]。诺姆·乔姆斯基、伊恩·罗伯茲、杰弗里·瓦图穆尔(Jeffrey Watumull)评价道,“鉴于这些系统的非道德性、伪科学性和语言无能,我们只能为它们的流行而感到哭笑不得”[83]。
2023年1月,在收到一首由ChatGPT以尼克·凱夫風格創作的歌曲後[73],歌曲作者本人在《紅手檔案》(The Red Hand Files) [84]上回應說,寫歌的行為是“一項血腥的事業…… .這需要我的一些東西來發起新的和新鮮的想法。它需要我的人性。”他繼續說,“儘管世界上所有的愛和尊重,這首歌都是胡說八道,是對人性的荒誕嘲弄,而且,好吧,我不太喜歡它。”[73][85]
2023年2月16日,杭州市某小区微信业主群一位业主將ChatGPT写的杭州於2023年3月1日取消限行的新闻稿发到群,杭州其實並未發表3月1日取消限行的措施,群員轉發錯誤資訊,錯誤資訊传播開去,最終警方介入调查,涉事业主在该微信群道歉[86]。
2023年2月22日,为了验证ChatGPT是否能代替医生问诊,浙江大学医学院附属第一医院精神卫生科医生吕海龙讓ChatGPT做一套由中国执业医师考试卷的题目组成的试卷,满分100分,最终ChatGPT的成绩卻是57分不及格。[87]
2023年3月31日,意大利隐私保护监管机构表示,由於ChatGPT不重视用户资料,而且无法核实用户年龄,该机构已封锁ChatGPT[88]。
2023年5月,美國紐約一名律師利用ChatGPT,為同事處理的訴訟蒐集資料,搜尋以往相關案例。該名律師曾多次向ChatGPT確認案例的真偽,惟ChatGPT每次均回答案例真實,結果被對家律師揭發,至少6宗案例並不存在,似是偽造。該名律師其後表示,後悔依賴生成式人工智能,此前從未使用該技術搜尋案例,不知道ChatGPT提供的內容有可能是假。該名律師最終須接受紀律聆訊。[89]
2023年11月,巴西一名地方法官因使用ChatGPT书写判决书出错而接受巴西国家司法委员会的调查。[90]
《大西洋月刊》的Stephen Marche指出它对学术界,尤其是入学申请论文的影响还有待了解[91]。加州高中教师兼作家丹尼尔·赫尔曼(Daniel Herman)写道,ChatGPT 将迎来“高中英语的终结”。[92]普林斯顿大学的高年级本科生Edward Tian创立了“GPTZero”——基于GitHub Copilot构建的应用程序[93],它可以扫描文本是否由另一AI编写,打击滥用[94][95]。
自2023年1月4日起,纽约市教育局已限制从其公立学校互联网和设备瀏覽ChatGPT[96]。
自2023年1月24日起,出版商施普林格·自然规定在其旗下所有期刊的论文中,ChatGPT等大语言模型不能列入作者[97]。同月26日,学术期刊《科学》禁止在论文中使用ChatGPT生成的文本,也禁止将ChatGPT署名为作者。[98]
2023年2月,香港大学计划与AI在教学上的影响在师生中发起讨论,但在此之前決定禁止在港大所有课堂、作业和评估中使用ChatGPT或其他AI工具[99][100]。
2023年3月31日,意大利政府以涉嫌侵犯隱私為由,宣布禁止使用ChatGPT,展開對OpenAI的調查。ChatGPT已在意大利下架,意大利成為第一個禁止使用ChatGPT的西方國家[101][102]。2023年4月28日,ChatGPT再度能在意大利使用,ChatGPT亦做出部分修改,包含增加年齡認證系統、讓使用者能得知ChatGPT的隱私政策以及使用者能拒絕提供訓練演算法用的資料[103]。
2023年4月10日,日本内阁官房长官松野博一表示,ChatGPT对个人信息的处理方面等问题应得到重视。在这些问题得到有效解决的前提下,将考虑使用ChatGPT减轻公务员的工作负担。[104]
2023年5月10日,有香港立法會議員詢問有關ChatGPT未有在開放使用的原因。香港政府則回應尊重個別機構就其產品製訂的推出策略及商業安排。[105]
三星电子DS部门于2023年3月11日批准员工使用ChatGPT后,陆续发生数起信息泄露事故。因此,三星电子发布新规,禁止在公司的设备和内部网络上使用生成式人工智慧系统。[107]
据《华尔街日报》报道,根据看到的一份文件及知情人士的消息,苹果公司已经限制其员工使用ChatGPT和其他外部AI工具。[108]
ChatGPT-4已在美國律師資格考贏過9成考生,也可以寫論文,參加任何升學考試都能考贏多數人,被視為寫作業和考試神器。台灣Google前董事總經理簡立峰,指出ChatGPT正在挑戰傳統式的教育,「ChatGPT正在挑戰我們傳統式的教育,我們的教育現場裡,把個人發展、差異化發展、學習動機等問題都簡化掉了。[109] 因應AI造成的影響,也有許多國家的教師嘗試化危機為轉機,將ChatGPT應用在教學或處理行政工作中。[110]
《时代周刊》调查显示,为了建立针对有害内容(例如性虐待、暴力、种族主义、性别歧视等)的安全系统,OpenAI使用每小时收入不到2美元的肯尼亚外判工来标记有害内容。这些标记用于训练模型以在未来检测此类内容。外判工接触到如此有害和危险的内容,以至于他们将这种经历描述为“折磨”。[111]
ChatGPT出现和流行增强了科技公司对該领域的兴趣和竞争。
2023年2月,Google推出類似於ChatGPT的对话人工智能服务Bard,基于其开发的对话编程语言模型(LaMDA)。Bard于2023年3月21日面向美国和英国用户发布,但有很多限制,文字处理仅支持美式英语[112]。
2023年5月10日,Google宣布Bard將支援多國語言及地區[113],除英文外將先提供日語及韓語等服務[114]。
2024年2月8日,更名為Gemini。
2023年2月20日晚间,在一些社交平台上开始传播“复旦大学自然语言处理实验室邱锡鹏教授团队推出对话式大型语言模型MOSS(得名于电影《流浪地球2》中的MOSS(550W量子計算機))”的消息。[116]一时间该项目官网瀏覽量激增,网站开始返回“{"message":"服务器流量过载,请明天上午重试"}
”的提示。2月21日,网站瀏覽恢复,并且添加了相关情况的说明。[117]
2023年3月14日,由清华技术成果转化的公司智谱AI基于GLM-130B千亿基座模型的ChatGLM开启邀请制内测,同时开源了中英双语对话模型ChatGLM-6B,支持在单张消费级显卡上进行推理使用。[118]
2023年4月7日,阿里云研发语言模型“通义千问”开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试,获得邀请码用户可通过官网参与体验。[119]
2023年5月6日,科大讯飞发布认知大模型“星火”。科大讯飞董事长刘庆峰表示,当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超ChatGPT,10月底将整体赶超ChatGPT。[120]
2023年3月,由前OpenAI员工共同创立的初创公司Anthropic推出了大型语言模型Claude。它可以被指示执行一系列任务,包括搜索文档,总结,写作和编码,以及回答有关特定主题的问题。在这些方面,它类似于OpenAI的ChatGPT。但Anthropic认为,Claude“不太可能产生有害的输出”,“更容易交谈”和“更容易操纵”。[121][122]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.