Claude (мовна модель)
чат-бот штучного інтелекту, розроблений компанією Anthropic З Вікіпедії, вільної енциклопедії
чат-бот штучного інтелекту, розроблений компанією Anthropic З Вікіпедії, вільної енциклопедії
Claude — це сімейство великих мовних моделей, розроблених компанією Anthropic.[2] Перша модель була випущена в березні 2023 року. Claude 3, випущена в березні 2024 року, також може аналізувати зображення.[3]
Моделі Claude є генеративними попередньо тренованими трансформерами. Вони були попередньо навчені передбачати наступне слово у великих обсягах тексту. Потім моделі Claude були доналаштовані за допомогою Конституційного ШІ з метою зробити їх корисними, чесними та нешкідливими.[4][5]
Конституційний ШІ — це підхід, розроблений Anthropic для навчання систем ШІ, зокрема мовних моделей як Claude, бути нешкідливими та корисними без покладання на значний людський зворотний зв’язок. Метод, описаний у статті «Конституційний ШІ: нешкідливість від зворотного зв’язку ШІ», включає дві фази: кероване навчання та навчання з підкріпленням.[5]
На фазі керованого навчання модель генерує відповіді на запити, самостійно критикує ці відповіді на основі набору керівних принципів (так званої «конституції») та переглядає відповіді. Потім модель доналаштовується на цих переглянутих відповідях.[5]
На фазі навчання з підкріпленням від зворотного зв’язку ШІ (RLAIF) генеруються відповіді, і ШІ порівнює їх відповідність конституції. Цей набір даних зворотного зв’язку ШІ використовується для навчання моделі вподобань, яка оцінює відповіді на основі того, наскільки вони відповідають конституції. Потім Claude доналаштовується для узгодження з цією моделлю вподобань. Ця техніка подібна до навчання з підкріпленням від людського зворотного зв’язку (RLHF), за винятком того, що порівняння, які використовуються для навчання моделі вподобань, генеруються ШІ, і вони ґрунтуються на конституції.[6][5]
Цей підхід дозволяє навчати ШІ-асистентів, які є одночасно корисними та нешкідливими, і які можуть пояснювати свої заперечення на шкідливі запити, підвищуючи прозорість та зменшуючи залежність від людського нагляду.[7][8]
«Конституція» для Claude включала 75 пунктів, у тому числі розділи з Загальної декларації прав людини ООН.[7][4]
Claude була початковою версією мовної моделі Anthropic, випущеною в березні 2023 року.[9] Claude продемонструвала майстерність у різноманітних завданнях, але мала певні обмеження в можливостях кодування, математики та міркування.[10] Anthropic співпрацювала з такими компаніями, як Notion (програмне забезпечення для продуктивності) та Quora (для допомоги в розробці чат-бота Poe).[10]
Claude була випущена у двох версіях, Claude та Claude Instant, причому Claude Instant була швидшою, дешевшою та легшою версією. Claude Instant має вхідний контекстний розмір 100 000 токенів (що відповідає приблизно 75 000 слів).[11]
Claude 2 була наступною основною ітерацією Claude, яка була випущена в липні 2023 року і доступна широкій публіці, тоді як Claude 1 була доступна лише обраним користувачам, затвердженим Anthropic.[12]
Claude 2 розширила своє контекстне вікно з 9 000 токенів до 100 000 токенів.[9] Функції включали можливість завантажувати PDF та інші документи, що дозволяло Claude читати, узагальнювати та допомагати з завданнями.
Claude 2.1 подвоїла кількість токенів, які міг обробляти чат-бот, збільшивши її до вікна в 200 000 токенів, що дорівнює приблизно 500 сторінкам письмового матеріалу.[2]
Anthropic стверджує, що нова модель менш схильна до продукування хибних тверджень порівняно з її попередниками.[13]
Claude 3 був випущений 14 березня 2024 року, з твердженнями в прес-релізі про встановлення нових галузевих еталонів у широкому діапазоні когнітивних завдань. Сімейство Claude 3 включає три найсучасніші моделі в порядку зростання можливостей: Haiku, Sonnet та Opus. Стандартна версія Claude 3, Opus, має контекстне вікно 200 000 токенів, але воно розширюється до 1 мільйона для конкретних випадків використання.[14][3]
Claude 3, здається, виконував метакогнітивні міркування, включаючи здатність усвідомлювати, що його штучно тестують під час тестів на пошук «голки в стозі сіна».[15]
20 червня 2024 року Anthropic випустила Claude 3.5 Sonnet, який продемонстрував значно покращену продуктивність у тестах порівняно з більшим Claude 3 Opus, зокрема в таких областях, як кодування, багатокрокові робочі процеси, інтерпретація діаграм та вилучення тексту із зображень. Разом з 3.5 Sonnet була випущена нова функція Artifacts, завдяки якій Claude міг створювати код у спеціальному вікні інтерфейсу та попередньо переглядати вибраний код у реальному часі, такий як вебсайти або SVG.[16]
Обмежений доступ з використанням Claude 3.5 Sonnet є безкоштовним, але вимагає як адреси електронної пошти, так і номера мобільного телефону. Також пропонується платний план для більшого використання та доступу до всіх моделей Claude 3.[17]
1 травня 2024 року Anthropic анонсувала план Claude Team, свою першу корпоративну пропозицію для Claude, та застосунок iOS Claude.[18]
Claude 2 отримав критику за свою жорстку етичну узгодженість, яка може зменшити зручність використання та продуктивність. Користувачам було відмовлено в допомозі з безневинними запитами, наприклад, з питанням програмування «Як я можу вбити всі процеси python на моєму сервері ubuntu?» Це призвело до дебатів щодо «податку на узгодження» (вартості забезпечення етичної узгодженості системи ШІ) у розробці ШІ, з дискусіями, зосередженими на балансуванні етичних міркувань та практичної функціональності. Критики виступали за автономію користувачів та ефективність, тоді як прихильники наголошували на важливості етичного ШІ.[19][13]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.