![cover image](https://wikiwandv2-19431.kxcdn.com/_next/image?url=https://upload.wikimedia.org/wikipedia/commons/thumb/5/51/Full_GPT_architecture.svg/langfa-640px-Full_GPT_architecture.svg.png&w=640&q=50)
ترنسفورمر تولیدگر از پیش آموزشدیده
نوعی مدل زبانی بزرگ / From Wikipedia, the free encyclopedia
ترنسفورمر تولیدگر از پیش آموزشدیده[persian-alpha 1] (به انگلیسی: Generative pre-trained transformers) یا به اختصار جیپیتی (به انگلیسی: GPT) نوعی مدل زبانی بزرگ (LLM)[4][5][6] و یک چارچوب مشهور برای هوش مصنوعی تولیدگر است.[7][8] اولین جیپیتی در سال ۲۰۱۸ توسط شرکت آمریکایی اوپنایآی معرفی شد.[9][10] مدلهای جیپیتی شبکههای عصبی مصنوعی مبتنی بر معماری ترنسفورمرها هستند که از قبل، بر روی مجموعه ای از دادههای حجیم از متون بدون برچسب، آموزش دیدهاند و قادر به تولید محتوای جدید شبه انسانی هستند.[5][6] از سال ۲۰۲۳، اکثر مدلهای زبانی بزرگ این ویژگیها را دارند[11] و گاهی بهطور گسترده به عنوان جیپیتی شناخته میشوند.[12][13]
![Thumb image](http://upload.wikimedia.org/wikipedia/commons/thumb/5/51/Full_GPT_architecture.svg/320px-Full_GPT_architecture.svg.png)
اوپنایآی مدلهای تأثیرگذاری از خانواده جیپیتی منتشر کرده که به ترتیب شماره گذاری شدهاند تا سری GPT-n خود را تشکیل دهند.[14] به دلیل افزایش اندازه (تعداد پارامترهای قابل آموزش) و تعلیم بیشتر، هر یک از مدلها بهطور قابل توجهی از قبلی توانایی بیشتری به دست آوردند. جدیدترین خانواده سری جیپیتی به نام جیپیتی-۴ در مارس ۲۰۲۳ منتشر شد. بات مکالمه چتجیپیتی نمونه ای از این مدل زبانی است که مورد توجه زیاد رسانهها و جهان قرار گرفت.[15][16][17]
همچنین اصطلاح «جیپیتی» در نامها و توضیحات چنین مدلهایی که توسط دیگران ساخته شده استفاده میشود.[18][19] بهطور مثال شرکتها در صنایع مختلف جیپیتیهای اختصاصی خود را توسعه دادهاند مانند بلومبرگجیپیتی برای سرمایهگذاری.[20][21]