GPT-4
red neuronal de OpenAI / De Wikipedia, la enciclopedia encyclopedia
GPT-4 (del inglés: Generative Pre-trained Transformer 4) es un modelo de lenguaje grande (LLM) creado por OpenAI. Se lanzó el 14 de marzo de 2023[1] y está disponible a través de la API y para los usuarios de ChatGPT Plus.[2][3][4] Como modelo basado en transformer, GPT-4 fue preentrenado para predecir el siguiente token (utilizando tanto datos públicos como "datos con licencia de proveedores de terceros"), y luego fue ajustado mediante aprendizaje por refuerzo a partir de retroalimentación humana e inteligencia artificial (IA), para lograr una alineación con el ser humano y cumplir con las políticas.[5]
GPT-4 | ||
---|---|---|
Parte de OpenAI API | ||
Información general | ||
Tipo de programa | LLM | |
Lanzamiento inicial | 14 de marzo de 2023 | |
Información técnica | ||
Programado en | Python | |
Serie OpenAI API | ||
ChatGPT y GPT-3 | GPT-4 | GPT-4o |
Enlaces | ||
Resumiendo rumores de otros sitios, la revista técnica Vox informó de que GPT-4 era "a todas luces" superior a los modelos GPT-3 y GPT-3.5 de OpenAI lanzados anteriormente.[6][7][8] The Verge también citó rumores de que aumentaría sustancialmente el número de parámetros de GPT-3 de 175.000 millones a 100 billones, algo que el director ejecutivo de OpenAI, Sam Altman, describió como "una completa idiotez".[9] Los representantes estadounidenses Don Beyer y Ted Lieu confirmaron al New York Times que Altman visitó el Congreso en enero de 2023 para hacer una demostración de GPT-4 y sus "controles de seguridad" mejorados en comparación con otros modelos de IA.[10]
La organización produjo tres versiones de GPT-4 con contexto de 8, 32 y 128 mil tokens, una mejora significativa sobre GPT-3.5 y GPT-3, que estaban limitados a 4 y 2 mil tokens respectivamente.[11] A diferencia de su predecesor, GPT-4 puede tomar imágenes además de texto como entradas.[12]