Claude é uma família de grandes modelos de linguagem desenvolvidos pela Anthropic.[1] O primeiro modelo foi lançado em março de 2023. Claude 3, lançado em março de 2024, também pode analisar imagens.[2]

Factos rápidos
Claude
Thumb
Desenvolvedor Anthropic
Plataforma Navegador, Android e iOS
Lançamento Março de 2023
Gênero(s) Modelo de linguagem grande

Chatbot

Licença Proprietário
Estado do desenvolvimento Ativo
Página oficial claude.ai
Fechar

Treinamento

Os modelos Claude são transformadores generativos pré-treinados. Eles foram pré-treinados para prever a próxima palavra em grandes quantidades de texto. Os modelos de Claude foram então ajustados com IA constitucional com o objetivo de torná-los úteis, honestos e inofensivos.[3][4]

IA constitucional

IA constitucional é uma abordagem desenvolvida pela Anthropic para treinar sistemas de IA, particularmente modelos de linguagem como Claude, para serem inofensivos e úteis sem depender de amplo feedback humano. O método, detalhado no artigo "Constitutional AI: Harmlessness from AI Feedback" envolve duas fases: aprendizagem supervisionada e aprendizagem por reforço.[4]

Na fase de aprendizagem supervisionada, o modelo gera respostas a prompts, autocrítica essas respostas com base em um conjunto de princípios orientadores (uma "constituição") e revisa as respostas. O modelo é então ajustado com base nessas respostas revisadas.[4]

Para a fase de aprendizado por reforço do feedback da IA (RLAIF), as respostas são geradas e uma IA compara sua conformidade com a constituição. Este conjunto de dados de feedback de IA é usado para treinar um modelo de preferência que avalia as respostas com base em quanto elas satisfazem a constituição. Claude é então ajustado para se alinhar a esse modelo de preferência. Esta técnica é semelhante à aprendizagem por reforço a partir do feedback humano (RLHF), exceto que as comparações usadas para treinar o modelo de preferência são geradas por IA e são baseadas na constituição.[5][4]

Esta abordagem permite a formação de assistentes de IA que sejam úteis e inofensivos, e que possam explicar as suas objeções a pedidos prejudiciais, aumentando a transparência e reduzindo a dependência da supervisão humana.[6][7]

A “constituição” para Claude inclui 75 pontos, incluindo seções da Declaração Universal dos Direitos Humanos da ONU.[6][3]

Modelos

O nome Claude foi notavelmente inspirado por Claude Shannon, um pioneiro em inteligência artificial.[8]

Claude

Claude foi a versão inicial do modelo de linguagem da Anthropic lançada em março de 2023,[9] Claude demonstrou proficiência em várias tarefas, mas tinha certas limitações em capacidades de codificação, matemática e raciocínio.[10] A Anthropic fez parcerias com empresas como a Notion (software de produtividade) e a Quora (para ajudar a desenvolver o chatbot Poe).[10]

Claude Instant

O Claude foi lançado em duas versões, Claude e Claude Instant, sendo o Claude Instant uma versão mais rápida, menos cara e mais leve. Claude Instant tem um comprimento de contexto de entrada de 100.000 tokens (o que corresponde a cerca de 75.000 palavras).[11]

Claude 2

Claude 2 foi a próxima grande iteração do Claude, que foi lançado em julho de 2023 e estava disponível para o público em geral, enquanto o Claude 1 estava disponível apenas para usuários selecionados aprovados pela Anthropic.[12]

Claude 2 expandiu sua janela de contexto de 9.000 tokens para 100.000 tokens.[9] Os recursos incluíam a capacidade de carregar PDFs e outros documentos que permitiam que Claude lesse, resumisse e auxiliasse nas tarefas.

Claude 2.1

O Claude 2.1 duplicou o número de tokens que o chatbot podia manipular, aumentando-o para uma janela de 200.000 tokens, o que equivale a cerca de 500 páginas de material escrito.[1]

A Anthropic afirma que o novo modelo tem menos probabilidade de produzir declarações falsas em comparação com seus antecessores.[13]

Claude 3

Claude 3 foi lançado em 14 de março de 2024, com alegações no comunicado à imprensa de ter estabelecido novos padrões no setor em uma ampla gama de tarefas cognitivas. A família Claude 3 inclui três modelos de última geração em ordem crescente de capacidade: Haiku, Sonnet e Opus. A versão padrão do Claude 3, Opus, tem uma janela de contexto de 200.000 tokens, mas ela está sendo expandida para 1 milhão para casos de uso específicos.[14][2]

Claude 3 chamou a atenção por demonstrar uma capacidade aparente de perceber que está sendo testado artificialmente durante os testes de agulha no palheiro.[15]

Claude 3.5

Em 20 de junho de 2024, a Anthropic lançou o Claude 3.5 Sonnet, que demonstrou desempenho significativamente melhorado em benchmarks em comparação ao Claude 3 Opus, principalmente em áreas como codificação, fluxos de trabalho de várias etapas, interpretação de gráficos e extração de texto de imagens. Junto com o 3.5 Sonnet foi lançado o novo recurso Artifacts, no qual Claude conseguiu criar código em uma janela dedicada na interface e visualizar a saída renderizada em tempo real, como gráficos SVG ou sites.[16]

Um "Soneto Claude 3.5 atualizado" foi introduzido em 22 de outubro de 2024, junto com o Haiku Claude 3.5. A Anthropic introduziu simultaneamente o "uso de computador" na API, o que permite que o Claude 3.5 Sonnet interaja com um ambiente de desktop de computador.[17]

Acesso

O acesso de uso limitado usando o Claude 3.5 Sonnet é gratuito, mas requer um endereço de e-mail e um número de celular. Um plano pago também é oferecido para maior uso e acesso a todos os modelos Claude 3.[18]

Em 1 de maio de 2024, a Anthropic anunciou o plano Claude Team, sua primeira oferta empresarial para Claude, e o aplicativo Claude para iOS.[19]

Crítica

O Claude 2 recebeu críticas por seu rigoroso alinhamento ético, que pode reduzir a usabilidade e o desempenho. Usuários tiveram assistência negada com solicitações benignas, por exemplo, com a questão de programação "Como posso matar todos os processos Python no meu servidor Ubuntu?" Isso levou a um debate sobre o "imposto de alinhamento" (o custo de garantir que um sistema de IA esteja alinhado no desenvolvimento de IA), com discussões centradas no equilíbrio entre considerações éticas e funcionalidade prática. Os críticos argumentaram pela autonomia e eficácia do usuário, enquanto os proponentes enfatizaram a importância da IA ética.[20][21]

Referências

Ligações externas

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.