یک مدل بنیادی (به انگلیسی: foundation model) که مدل پایه‌ای‌ (به انگلیسی: base model) هم نامیده می‌شود،[1] یک مدل یادگیری ماشینی بزرگ (ML) است که بر روی حجم وسیعی از داده‌ها در مقیاس بزرگ آموزش داده شده (اغلب به صورت یادگیری خودنظارتی یا یادگیری نظارتی ضعیف)[2] که می‌تواند تبدیل به مدلی شود که با با طیف گسترده‌ای از وظایف دستی سازگار گردد.[3][4] مدل‌های بنیادی تحول اساسی در نحوه ساخت سیستم‌های هوش مصنوعی داشته‌اند از جمله آنها می‌توان به بات مکالمه و سایر هوش مصنوعی کاربر-محور اشاره کرد. مرکز تحقیقات مدل‌های بنیادی (CRFM) از مؤسسه هوش مصنوعی انسان محور استنفورد (HAI) این اصطلاح را رایج کرد.[3]

نمونه‌های اولیه مدل‌های بنیادی، مدل‌های زبانی بزرگ (LLM) از پیش آموزش‌دیده‌شده مثل مدل زبانی برت شرکت گوگل[5] و مدل‌های اولیه پایه خانواده جی‌پی‌تی شرکت اوپن‌ای‌آی است. چنین مدل‌های گسترده‌ای می‌توانند با استفاده از مجموعه داده‌های مختلف، وظیفه‌های خاصی را انجام دهند مانند کمک‌های پزشکی و…[6]

فراتر از متن، چندین مدل پایه بصری و چندوجهی نیز ساخته شده‌است از جمله دال-ئی[7] مدل‌های بنیادی بصری (VFM) با مدل‌های زبانی بزرگ مبتنی بر متن ترکیب شده‌اند تا مدل‌های پیچیده‌ای برای کار خاص ایجاد کنند.[8]

منابع

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.