Anthropic lança três novas versões para seu chatbot Claude

Os novos modelos serão capazes de analisar imagens, mas não terão a capacidade de gerar imagens. Segundo o CEO Dario Amodei, os clientes não estão demandando esse recurso

Por Bloomberg — São Francisco


Site da Anthropic, que lançou três novos modelos para seu chatbot Claude Gabby Jones/Bloomberg

A startup de inteligência artificial Anthropic está lançando um novo software para seu chatbot Claude, que será melhor na execução de instruções complicadas e menos propenso a inventar coisas.

Na segunda-feira, a Anthropic, sediada em São Francisco, apresentou três novos modelos de IA - Claude 3 Opus, Sonnet e Haiku. Os nomes literários sugerem os recursos de cada modelo, sendo Opus o mais poderoso e Haiku o mais leve e rápido.

O Opus e o Sonnet já estão disponíveis para os desenvolvedores, enquanto o Haiku chegará nas próximas semanas, informou a empresa na segunda-feira.

Os chatbots capazes de imitar conversas humanas têm se tornado um foco cada vez maior das empresas do Vale do Silício, com os rápidos avanços tecnológicos alimentando um frenesi de investimentos.

Embora os chatbots em si não sejam novos, a tecnologia que alimenta os bots da Claude e dos concorrentes é uma ferramenta mais poderosa conhecida como modelo de linguagem ampla, que é treinada em grandes áreas da Internet para gerar texto, como uma resposta a uma pergunta ou um poema.

Essas ferramentas são uma aplicação da IA generativa, sistemas que consideram a entrada, como um prompt de texto, e a utilizam para gerar novo conteúdo.

Mas a tecnologia tem problemas. Por exemplo, os chatbots são propensos a dizer coisas que não são verdadeiras, um problema às vezes chamado de alucinações. "Esses modelos ainda são apenas treinados para prever a próxima palavra - é muito, muito difícil chegar a uma taxa de alucinação de zero por cento", disse Daniela Amodei, presidente da Anthropic.

Em seu último lançamento, a empresa tentou resolver o problema, uma prioridade para os clientes da Anthropic, disse Amodei. A empresa disse que as novas versões do software Claude têm duas vezes mais probabilidade de oferecer respostas corretas às perguntas e menos probabilidade de inventar coisas.

A Anthropic foi formada em 2021 por ex-funcionários da OpenAI, incluindo Daniela Amodei e seu irmão Dario, que atua como CEO. Desde então, a empresa se tornou uma das maiores concorrentes da OpenAI, levantando bilhões em financiamento de capital de risco. A maioria de seus clientes são empresas, desde o mecanismo de busca DuckDuckGo até a editora de guias de viagem Lonely Planet.

A Anthropic enfatizou o desenvolvimento de IA de forma segura e responsável, o que, às vezes, limitou seu desempenho. Por exemplo, as versões mais antigas do Claude frequentemente se recusavam a responder a consultas inofensivas, segundo a empresa, porque elas pareciam problemáticas para o software.

Os novos modelos apresentados na segunda-feira fazem isso com muito menos frequência, disse a empresa.

"A ciência de controlar o treinamento de sistemas de IA continua imperfeita - está melhorando a cada dia, mas continua imperfeita", disse Dario Amodei.

Em um esforço para ajudar os usuários a sentirem que podem confiar nos resultados que obtêm do Claude, as versões mais recentes do software em breve começarão a citar frases em materiais de referência para respaldar as respostas que geram, disse a empresa.

Os novos modelos serão capazes de analisar imagens, um recurso que a Bloomberg informou anteriormente que a empresa estava trabalhando. Essa tecnologia permite que os programas realizem tarefas como identificar a raça de um cachorro em uma foto, comparar duas fotos de camisetas ou descrever uma obra de arte - algo que o Google Gemini da Alphabet e o ChatGPT da OpenAI já oferecem.

A empresa está optando por não adicionar a capacidade de gerar imagens, como fazem os chatbots da OpenAI e do Google. Dario Amodei disse que os clientes da Anthropic não estão demandando esse recurso.

Em uma ação que o CEO admitiu ser "muito centrada no Vale do Silício", a empresa testou a capacidade dos novos modelos de recuperar trechos específicos de texto colocados em documentos extensos com o uso de um conjunto de ensaios escritos por Paul Graham, cofundador da aceleradora de startups Y Combinator - uma prática de treinamento que outras startups também disseram ter feito.

O modelo de nível intermediário da empresa, Sonnet, agora está alimentando a versão on-line do Claude disponível ao público. As pessoas que pagam por uma assinatura do Claude Pro podem usar a versão mais avançada, o Opus.

Mais recente Próxima Chamada de áudio e vídeo do X, ex-Twitter, dá acesso à localização de usuários. Saiba como impedir