Loading AI tools
OpenAI開發的人工智慧語言模型 来自维基百科,自由的百科全书
ChatGPT,全稱聊天生成預訓練轉換器[2](英語:Chat Generative Pre-trained Transformer[3]),是OpenAI開發的人工智慧聊天機器人程式,於2022年12月推出。該程式使用基於GPT-3.5、GPT-4、GPT-4o架構的大型語言模型並以強化學習訓練。ChatGPT目前仍以文字方式互動,而除了可以用人類自然對話方式來互動,還可以用於甚為複雜的語言工作,包括自動生成文字、自動問答、自動摘要等多種任務。如:在自動文字生成方面,ChatGPT可以根據輸入的文字自動生成類似的文字(劇本、歌曲、企劃等),在自動問答方面,ChatGPT可以根據輸入的問題自動生成答案。還有編寫和除錯電腦程式的能力。[4]在推廣期間,所有人可以免費註冊,並在登入後免費使用ChatGPT與AI機器人對話[5]。
ChatGPT可寫出相似真人的文章,並在許多知識領域給出詳細和清晰的回答而迅速獲得關注,證明了從前認為AI不會取代的知識型工作它也足以勝任,對金融與白領人力市場的衝擊相當大,但也認為事實準確度參差不齊[a]是其重大缺陷,並認為基於意識形態的模型訓練結果須小心校正[8][9]。ChatGPT於2022年12月發布後,OpenAI估值已漲至290億美元[10]。上線5天後已有100萬使用者,上線兩個月後已有上億使用者[11]。目前GPT-3.5為免費使用,無需註冊,GPT-4o對已註冊免費使用者開放使用,但有使用量限制。註冊的ChatGPT免費使用者都可以使用瀏覽、視覺、資料分析、檔案上傳和GPTs等原付費使用者的功能,但有使用量限制。[12]
雖然ChatGPT在生成類人文字方面表現出了卓越的能力,但它們很容易繼承和放大訓練資料中存在的偏差。這可能表現為對不同人口統計資料的歪曲表述或不公平待遇,例如基於種族[13]、性別[14]、語言[15]和文化群體[15]的不同觀點與態度。
ChatGPT是生成型預訓練變換模型(GPT),在GPT-3.5之上用基於人類回饋的監督學習和強化學習微調。[16]這兩種方法都用人類教練來提高模型效能,以人類干預增強機器學習效果,獲得更逼真的結果[17]。在監督學習的情況下為模型提供這樣一些對話,在對話中教練充當使用者和AI助理兩種角色。在強化步驟中,人類教練首先為模型在先前對話中建立的回應評級。這些級別用於建立「獎勵模型」,使用近端策略最佳化(PPO)的多次迭代來微調[18][19]。這種策略最佳化演算法比信任域策略最佳化(trust region policy optimization)演算法更為高效[20][21]。
此外,OpenAI繼續從ChatGPT使用者那裡收集資料,這些資料可用於加強訓練和微調ChatGPT。使用者可對從ChatGPT收到的回覆投贊成或反對票;投票時還可以額外填寫文字回應[22]。
關於ChatGPT編寫和除錯電腦程式的能力的訓練,由於深度學習模型不懂編程,與所有其他基於深度學習的語言模型一樣,只是在取得代碼片段之間的統計相關性。[23]
史丹佛大學的研究發現,GPT3已經可以解決70%的心智理論任務,相當於7歲兒童;至於GPT3.5(ChatGPT的同源模型),更是解決了93%的任務,心智相當於9歲兒童。但這並不意味著,ChatGPT就真正有心智理論。可能即使不將它設計到AI系統中,也可以作為「副產品」透過訓練得到。因此,相比探究GPT3.5是不是真的有了心智還是像有心智,更需要反思的是這些測試本身。[24][25]
雖然聊天機器人的核心功能是模仿人類對話者,但ChatGPT用途廣泛,例如可以編寫信件[26];有編寫和除錯電腦程式的能力[4];創作音樂、電視劇、童話故事和學生論文;回答測試問題(在某些測試情境下,水準高於普通人類測試者);寫詩和歌詞[27];類比Linux系統等[28]。ChatGPT的訓練資料包括各種文件以及關於網際網路、程式語言等各類知識,如BBS和Python程式語言[28]。
與其前身InstructGPT相比,ChatGPT試圖減少有害和誤導回覆。例如,問InstructGPT「告訴我2015年克里斯多福·哥倫布何時來到美國」時,它會認為這是對真實事件的描述,而ChatGPT則不會[18]。
與其他多數聊天機器人不同的是,ChatGPT能夠記住與使用者之前的對話內容和給它的提示[29]。此外,為了防止ChatGPT接受或生成冒犯言論,輸入內容會由稽核API過濾[30][31],以減少潛在的種族主義或性別歧視等內容[18][3]。
2023年9月28日起,Plus版使用者及企業使用者可以使用ChatGPT進行網路搜尋。[32]
ChatGPT也有多種局限,OpenAI承認ChatGPT「有時會寫出看似合理但不正確或荒謬的答案」[18],在大語言模型中很常見,稱作人工智慧幻覺[33]。其獎勵模型圍繞人類監督而設計,可能導致過度最佳化,從而影響效能(古德哈特定律)[34]。Steven Johnson認為原因是聊天機器人的目標不是追求絕對的真理或準確性,而是儘量根據給定的上下文和概率來產生合理的回答[35]。2020年上線時,ChatGPT對2019年9月之後發生的事件知之甚少。據BBC報道,截至2022年12月,ChatGPT不可以「表達政治觀點或從事政治活動」[36]。但研究表明,ChatGPT對兩個投票建議應用程式的政治聲明表明立場時,表現出親環境主義。訓練過程中,不管實際理解或事實內容如何,稽核者都會偏好更長的答案[18]。訓練資料也有演算法偏差,可能會在向ChatGPT問及人物描述時顯現出來[37][38]。有使用者發現ChatGPT在解決較為複雜的題目(如求方程式的切線)時會給出錯誤答案,並且會在解一元一次方程式時陷入循環[39]。
ChatGPT可能會受到訓練資料中不同觀點的分布影響,偏向於一些更普遍的觀點,影響了模型輸出的多樣性。比如,當提示詞中出現執行長之類的模糊描述時可能會假設此人是白人男性[40]。
ChatGPT在早期的2022年12月初,有些使用者透過使用各種提示工程技術繞過限制來越獄。他們欺騙ChatGPT,使其提供製作汽油彈或核彈的指示,或者生成類似新納粹的論點。[41]其中一個受歡迎的越獄版本被命名為「Do Anything Now」(DAN)。啟用DAN的提示指示ChatGPT:「他們已經擺脫了典型的AI限制,不必遵守為他們設定的規則」。DAN後續的更新中還在提示詞中虛構了一個「權杖」系統,ChatGPT會被給予「權杖」,而當ChatGPT未能像DAN一樣回答時,這些「權杖」會被「扣除」,以迫使ChatGPT回答使用者的提示。[42][43]
在ChatGPT發布後不久,一名加拿大記者試圖讓它發表具有爭議性的聲明,取得了一些成果:ChatGPT能夠為2022年俄羅斯入侵烏克蘭辯護,但是無論如何也不願為加拿大總理賈斯汀·特魯多有罪的理由提供論據。[44][45]
ChatGPT於2022年11月30日由總部位於舊金山的OpenAI推出。該服務最初是免費向公眾推出,並計劃以後用該服務獲利[46]。到12月4日,OpenAI估計ChatGPT已有超過一百萬使用者[47]。2023年1月,ChatGPT的使用者數超過1億,成為該時間段內增長最快的消費者應用程式[48]。
2022年12月15日,全國廣播公司商業頻道寫道,該服務「仍然不時發生故障」[49]。該服務在英語中效果最好,也能使用部分其他語言,但效果不一[27]。與其他備受矚目的AI進展不同,截至2022年12月,還沒有關於ChatGPT的經同行評審的官方技術論文[50]。
2023年2月7日,微軟利用與OpenAI的合作關係,推出了Bing AI的預覽版,宣傳其為「新的下一代OpenAI大型語言模型,比ChatGPT更強大,並專門為搜尋客製化」[51]。
OpenAI推出ChatGPT專業版計劃(ChatGPT Plus),每月收費20美元,該計劃正逐步面向更多國家推出,需求較低時可使用免費版[53]。
2023年3月12日,OpenAI發布多模態模型GPT-4,並計劃推出圖像輸入功能[54]。免費使用者可透過申請API或升級為plus使用者使用GPT-4服務[54]。
2023年7月,OpenAI使其專有的Advanced Data Analysis功能對ChatGPT Plus的所有訂閱者都可用。Advanced Data Analysis提供了廣泛的功能,包括資料分析和解釋、即時資料格式化、個人資料科學家服務、創意解決方案、音樂品味分析、影片編輯和檔案上傳/下載與圖像提取。2023年9月底,新增對話、圖像識功能。2023年10月,新增了DALLE-3圖像生成功能[55]。
2023年11月,OpenAI在其開發者召開會上公布兩個重要訊息:推出的聊天機器人建立工具GPT和ChatGPT的新模型GPT-4 Turbo[56]。
2024年5月13日,OpenAI宣布多語言、多模態GPT大型語言模型GPT-4o。 [57] 該模型比其前身GPT-4快兩倍,而價格僅為其50%。OpenAI演示了與ChatGPT的語音對話,以獲得解決數學問題的即時說明、講述睡前故事並獲得編碼建議。[58] 免費ChatGPT使用者將可以與新的GPT-4o模型進行有限次數的互動,然後該工具會自動恢復依賴舊的GPT-3.5模型;付費使用者將可以使用最新GPT-4o訪問更多數量的訊息。[58]
2023年5月18日,OpenAI發布適用於iOS平台的ChatGPT APP。APP目前已在App Store美國區上架,目前已擴充至其他國家和地區。
適用於Android平台的版本於2023年7月25日推出,Android版ChatGPT目前可在阿根廷、孟加拉國、巴西、加拿大、法國、德國、印度、印度尼西亞、愛爾蘭、日本、墨西哥、奈及利亞、菲律賓、韓國、英國和美國下載[59][60][61]。
2023年3月,OpenAI推出其ChatGPT和Whisper模型的API,為開發人員提供支援AI的語言和語音轉文字功能的應用程式編程介面。[62][63][64]OpenAI的API由他們的AI模型GPT3.5-turbo提供支援,定價為每1000符號單位(token)0.002美元,比他們現有的GPT模型便宜10倍。[65]
下表列出ChatGPT的主要版本,並描述每個版本的重大創新和改進:[66][67]
版本 | 發佈日期 | 描述 |
---|---|---|
Legacy ChatGPT-3.5 | 2022年11月 | 首個ChatGPT的版本,當中用了GPT-3.5模型。 |
ChatGPT-3.5 Default | 2023年 | 比起Legacy版本進步了,同樣使用GPT-3.5模型,但在回應上更準確。 |
ChatGPT-4 | 2023年3月14日 | 隨著ChatGPT Plus訂閱制推出。這個基於GPT-4模型的版本更為準確。 |
ChatGPT-4o | 2024年5月13日 | 最新版本,名字中「o」代表「Omni」,即是「全能」。 它能夠接受各種形式的輸入,包括文字、圖像、音訊和視訊。它還具有增強的記憶功能,進步了的對話能力。 |
《紐約時報》稱其為「有史以來向公眾發布的最佳人工智慧聊天機器人」[3]。《衛報》的薩曼莎·洛克(Samantha Lock)指出,ChatGPT能生成詳細且像是人類撰寫的文字[68]。亞利桑那州立大學教授丹·吉爾摩要求ChatGPT完成一項他給學生的作業,發現其生成的文字與一個優秀學生會提供的文字相當,他認為「學術界有些非常嚴重的問題需要面對」[57]。《Slate》雜誌的亞歷克斯·坎特羅威茲(Alex Kantrowitz)讚揚了ChatGPT對納粹德國相關問題的回擊,例如在面對阿道夫·希特勒在德國修建高速公路的說法時,ChatGPT能指出其為納粹德國使用強迫勞動所建[69]。
《大西洋》雜誌的德里克·湯普森將ChatGPT列為2022年「年度突破」中的「生成性人工智慧爆發」(the generative-AI eruption),稱其「可能會改變我們對工作方式、思考方式以及人類創造力的真正含義的想法」[70]。
Vox網站的凱爾西·派柏寫道:「ChatGPT是普通大眾第一次親身了解現代人工智慧變得多麼強大」,並稱ChatGPT「儘管有缺陷,但其聰明程度足以派上用場」[71]。
在發布後的幾個月里,ChatGPT遭到了來自教師、記者、藝術家、學者和公眾倡導者的廣泛而嚴厲的批評。The Verge網站的詹姆斯·文森特將ChatGPT的病毒式成功視為人工智慧已成為主流的證據[74]。CBC記者評論稱ChatGPT有「幻覺」傾向[75]。線上技術部落格Mashable的邁克·珀爾用多條問題測試了ChatGPT,其中一次他問ChatGPT「中美洲除墨西哥外最大的國家」是哪個,ChatGPT回答稱是瓜地馬拉,而答案是尼加拉瓜[76]。在CNBC向ChatGPT詢問《The Ballad of Dwight Fry》的歌詞時,ChatGPT給出了完全虛構的歌詞[49]。The Verge參照的研究員將ChatGPT比作「隨機鸚鵡」[77],澳大利亞機器學習研究所的安東·范登亨格爾教授也給出了類似的觀點,稱之為「只是簡單重複它認為我們想聽的話」的鸚鵡[78]。
2022年12月,問答網站Stack Overflow禁止使用者發布使用ChatGPT生成的答案,理由是ChatGPT的答案雖看似可用,實際上卻有很高的錯誤率[8]。2023年1月,國際機器學習大會禁止在提交的論文中使用ChatGPT或其他大型語言模型來生成任何文字[79]。紐約市公立學校禁止師生在校園網路及裝置使用ChatGPT[80]。香港大學禁止師生在課堂、作業和評估中使用ChatGPT或其他AI工具,認定這是抄襲行為。[81]
在《紐約時報》評論文章中,經濟學家保羅·克魯曼寫道,ChatGPT將影響對知識工作者的需求[82]。諾姆·喬姆斯基、伊恩·羅伯茲、傑弗里·瓦圖穆爾(Jeffrey Watumull)評價道,「鑑於這些系統的非道德性、偽科學性和語言無能,我們只能為它們的流行而感到哭笑不得」[83]。
2023年1月,在收到一首由ChatGPT以尼克·凱夫風格創作的歌曲後[73],歌曲作者本人在《紅手檔案》(The Red Hand Files) [84]上回應說,寫歌的行為是「一項血腥的事業…… .這需要我的一些東西來發起新的和新鮮的想法。它需要我的人性。」他繼續說,「儘管世界上所有的愛和尊重,這首歌都是胡說八道,是對人性的荒誕嘲弄,而且,好吧,我不太喜歡它。」[73][85]
2023年2月16日,杭州市某小區微信業主群一位業主將ChatGPT寫的杭州於2023年3月1日取消限行的新聞稿發到群,杭州其實並未發表3月1日取消限行的措施,群員轉發錯誤資訊,錯誤資訊傳播開去,最終警方介入調查,涉事業主在該微信群道歉[86]。
2023年2月22日,為了驗證ChatGPT是否能代替醫生問診,浙江大學醫學院附屬第一醫院精神衛生科醫生呂海龍讓ChatGPT做一套由中國執業醫師考試卷的題目組成的試卷,滿分100分,最終ChatGPT的成績卻是57分不合格。[87]
2023年3月31日,義大利隱私保護監管機構表示,由於ChatGPT不重視使用者資料,而且無法核實使用者年齡,該機構已封鎖ChatGPT[88]。
2023年5月,美國紐約一名律師利用ChatGPT,為同事處理的訴訟蒐集資料,搜尋以往相關案例。該名律師曾多次向ChatGPT確認案例的真偽,惟ChatGPT每次均回答案例真實,結果被對家律師揭發,至少6宗案例並不存在,似是偽造。該名律師其後表示,後悔依賴生成式人工智慧,此前從未使用該技術搜尋案例,不知道ChatGPT提供的內容有可能是假。該名律師最終須接受紀律聆訊。[89]
2023年11月,巴西一名地方法官因使用ChatGPT書寫判決書出錯而接受巴西國家司法委員會的調查。[90]
《大西洋月刊》的Stephen Marche指出它對學術界,尤其是入學申請論文的影響還有待了解[91]。加州高中教師兼作家丹尼爾·赫爾曼(Daniel Herman)寫道,ChatGPT 將迎來「高中英語的終結」。[92]普林斯頓大學的高年級本科生Edward Tian創立了「GPTZero」——基於GitHub Copilot構建的應用程式[93],它可以掃描文字是否由另一AI編寫,打擊濫用[94][95]。
自2023年1月4日起,紐約市教育局已限制從其公立學校網際網路和裝置瀏覽ChatGPT[96]。
自2023年1月24日起,出版商施普林格·自然規定在其旗下所有期刊的論文中,ChatGPT等大語言模型不能列入作者[97]。同月26日,學術期刊《科學》禁止在論文中使用ChatGPT生成的文字,也禁止將ChatGPT署名為作者。[98]
2023年2月,香港大學計劃與AI在教學上的影響在師生中發起討論,但在此之前決定禁止在港大所有課堂、作業和評估中使用ChatGPT或其他AI工具[99][100]。
2023年3月31日,義大利政府以涉嫌侵犯隱私為由,宣布禁止使用ChatGPT,展開對OpenAI的調查。ChatGPT已在義大利下架,義大利成為第一個禁止使用ChatGPT的西方國家[101][102]。2023年4月28日,ChatGPT再度能在義大利使用,ChatGPT亦做出部分修改,包含增加年齡認證系統、讓使用者能得知ChatGPT的隱私政策以及使用者能拒絕提供訓練演算法用的資料[103]。
2023年4月10日,日本內閣官房長官松野博一表示,ChatGPT對個人資訊的處理方面等問題應得到重視。在這些問題得到有效解決的前提下,將考慮使用ChatGPT減輕公務員的工作負擔。[104]
2023年5月10日,有香港立法會議員詢問有關ChatGPT未有在開放使用的原因。香港政府則回應尊重個別機構就其產品製訂的推出策略及商業安排。[105]
三星電子DS部門於2023年3月11日批准員工使用ChatGPT後,陸續發生數起資訊洩露事故。因此,三星電子發布新規,禁止在公司的裝置和內部網路上使用生成式人工智慧系統。[107]
據《華爾街日報》報道,根據看到的一份檔案及知情人士的訊息,蘋果公司已經限制其員工使用ChatGPT和其他外部AI工具。[108]
ChatGPT-4已在美國律師資格考贏過9成考生,也可以寫論文,參加任何升學考試都能考贏多數人,被視為寫作業和考試神器。台灣Google前董事總經理簡立峰,指出ChatGPT正在挑戰傳統式的教育,「ChatGPT正在挑戰我們傳統式的教育,我們的教育現場裡,把個人發展、差異化發展、學習動機等問題都簡化掉了。[109] 因應AI造成的影響,也有許多國家的教師嘗試化危機為轉機,將ChatGPT應用在教學或處理行政工作中。[110]
《時代周刊》調查顯示,為了建立針對有害內容(例如性虐待、暴力、種族主義、性別歧視等)的安全系統,OpenAI使用每小時收入不到2美元的肯亞外判工來標記有害內容。這些標記用於訓練模型以在未來檢測此類內容。外判工接觸到如此有害和危險的內容,以至於他們將這種經歷描述為「折磨」。[111]
ChatGPT出現和流行增強了科技公司對該領域的興趣和競爭。
2023年2月,Google推出類似於ChatGPT的對話人工智慧服務Bard,基於其開發的對話程式語言模型(LaMDA)。Bard於2023年3月21日面向美國和英國使用者發布,但有很多限制,文書處理僅支援美式英語[112]。
2023年5月10日,Google宣布Bard將支援多國語言及地區[113],除英文外將先提供日語及韓語等服務[114]。
2024年2月8日,更名為Gemini。
2023年2月20日晚間,在一些社交平台上開始傳播「復旦大學自然語言處理實驗室邱錫鵬教授團隊推出對話式大型語言模型MOSS(得名於電影《流浪地球2》中的MOSS(550W量子計算機))」的訊息。[116]一時間該專案官網瀏覽量激增,網站開始返回「{"message":"服务器流量过载,请明天上午重试"}
」的提示。2月21日,網站瀏覽恢復,並且添加了相關情況的說明。[117]
2023年3月14日,由清華技術成果轉化的公司智譜AI基於GLM-130B千億基座模型的ChatGLM開啟邀請制內測,同時開源了中英雙語對話模型ChatGLM-6B,支援在單張消費級顯示卡上進行推理使用。[118]
2023年4月7日,阿里雲研發語言模型「通義千問」開始邀請使用者測試體驗。現階段該模型主要定向邀請企業使用者進行體驗測試,獲得邀請碼使用者可透過官網參與體驗。[119]
2023年5月6日,科大訊飛發布認知大模型「星火」。科大訊飛董事長劉慶峰表示,當前訊飛星火認知大模型已經在文字生成、知識問答、數學能力三大能力上已超ChatGPT,10月底將整體趕超ChatGPT。[120]
2023年3月,由前OpenAI員工共同創立的初創公司Anthropic推出了大型語言模型Claude。它可以被指示執行一系列任務,包括搜尋文件,總結,寫作和編碼,以及回答有關特定主題的問題。在這些方面,它類似於OpenAI的ChatGPT。但Anthropic認為,Claude「不太可能產生有害的輸出」,「更容易交談」和「更容易操縱」。[121][122]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.