From Wikipedia, the free encyclopedia
GPT-4o (GPT-4 Omni) és un transformador generatiu pre-entrenat multilingüe i multimodal dissenyat per OpenAI. Va ser anunciat per la directora de tecnologia d'OpenAI, Mira Murati, durant una demostració en directe el 13 de maig de 2024 i es va publicar el mateix dia.[1] GPT-4o és gratuït, però amb un límit d'ús 5 vegades superior per als subscriptors de ChatGPT Plus.[2] Pot processar i generar text, imatges i àudio.[3] La seva API és el doble de ràpida i té la meitat del preu del seu predecessor, GPT-4 Turbo.[1]
Tipus | transformadors generatius pre-entrenats, model d'intel·ligència artificial i model de fundació |
---|---|
Versió inicial | 13 maig 2024 |
Llicència | llicència de propietat |
Disponible en | |
Epònim | GPT-4 |
Part de | OpenAI API |
Característiques tècniques | |
Dispositiu d'entrada | micròfon, càmera digital i teclat d'ordinador |
Equip | |
Desenvolupador(s) | OpenAI |
Editor | OpenAI |
Més informació | |
Lloc web | openai.com… (anglès) |
| |
Originalment, diverses versions de GPT-4o es van llançar en secret amb diferents noms al bot de conversa Arena de la Large Model Systems Organization (LMSYS) com a 3 models diferents. Aquests 3 models es van anomenar gpt2-chatbot, im-a-good-gpt2-chatbot i im-also-a-good-gpt2-chatbot.[4] El 7 de maig de 2024, Sam Altman va tuitar "im-a-good-gpt2-chatbot", que s'interpretava habitualment com una confirmació que es tractava de nous models OpenAI que s'estaven provant.[5][6]
GPT-4o va aconseguir resultats d'última generació en trets de veu, multilingüisme i visió, establint nous rècords en reconeixement de veu i traducció d'àudio.[7][8] GPT-4o va obtenir un 88,7 en la comparativa Massive Multitask Language Understanding (MMLU) en comparació amb el 86,5 de GPT-4.[9] A diferència de GPT-3.5 i GPT-4, que depenen d'altres models per processar el so, GPT-4o admet de manera nativa el veu a veu, fent que la resposta sigui gairebé instantània i perfecta.[9] Sam Altman va assenyalar el 15 de maig de 2024 que les capacitats de veu a veu del GPT-4o encara no estaven integrades a ChatGPT i que encara s'estava utilitzant la versió antiga.[10]
El model admet més de 50 idiomes,[1] que OpenAI afirma que cobreixen més del 97% dels parlants.[11] Mira Murati va demostrar la capacitat multilingüe del model parlant italià amb el model i fent-lo traduir entre l'anglès i l'italià durant l'esdeveniment de demostració d'OpenAI en directe el 13 de maig de 2024. A més, el nou tokenitzador utilitza menys fitxes per a determinats idiomes, especialment idiomes que no es basen en l'alfabet llatí, el que fa que sigui més barat per a aquests idiomes.[9]
GPT-4o incorpora coneixements fins a l'octubre de 2023[12][13] i té una longitud de context de 128.000 fitxes [12] amb un límit de testimonis de sortida de 2.048.[13]
A partir del maig de 2024, és el model líder en el sistema de puntuació Elo Arena de LMSYS de la Universitat de Califòrnia, Berkeley.[14]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.