Tecnologia
PUBLICIDADE
Por — São Paulo

A OpenAI anunciou nesta segunda-feira que irá abrir para todos os usuários a sua versão mais poderosa até aqui do ChatGPT, alimentada pelo GPT-4o, novo modelo de inteligência artificial (IA) da empresa. A atualização permite que o robô processe imagem, texto e voz em tempo real e de forma mais eficiente. O objetivo é criar uma interação humano-computador "muito mais natural", segundo a companhia.

— Uma parte importante da nossa missão é poder disponibilizar nossas ferramentas avançadas de IA para todos gratuitamente. — afirmou Mira Murati, diretora de tecnologia da OpenAI, durante o "Spring Update", evento que apresentou o GPT-4o.

Murati acrescentou que o novo modelo é "muito mais rápido" do que a vesão anterior, o GPT-4, além de ter capacidade maior de processar texto, imagem e áudio.

De acordo com a executiva, os assinantes do serviço vão poder processar "cinco vezes" mais conteúdos na versão paga. Na versão gratuita, haverá um limite de mensagens que poderão ser trocadas com o GPT-4o. "Quando o limite for atingido, o ChatGPT mudará automaticamente para GPT-3.5 (uma versão anterior)", explica a empresa.

ChatGPT sugere que funcionário da OpenAI arrume o cabelo para participar de entrevista — Foto: Reprodução/OpenAI
ChatGPT sugere que funcionário da OpenAI arrume o cabelo para participar de entrevista — Foto: Reprodução/OpenAI

Depois do evento em que apresentou o GPT-4o, a OpenAI divulgou uma série de demonstrações das novas funções do sistema. Em vídeos curtos, funcionários da companhia contam piadas para o ChatGPT (que responde com risada), pedem para a ferramenta cantar "parabéns" a um aniversariante e escutam conselhos do robô sobre como melhorar o visual para participar de uma entrevista.

— O GPT-4o é o nosso melhor modelo de todos os tempos. É inteligente, é rápido e é nativamente multimodal— escreveu o CEO da OpenAI, Sam Altman, nas redes sociais.

Essa é a primeira vez que um modelo de inteligência artificial da OpenAI já nasce multimodal (com treinamento de texto, áudio e visão juntos). A voz do GPT-4o também foi aprimorada - é menos robótica que as versões anteriores. Com esse salto, a empresa de Altman leva para o ChatGPT características de assistentes pessoais - como a Alexa, da Amazon, e a Siri, da Apple -, mas com mais funcionalidades.

Outra novidade apresentada nesta segunda-feira é a chegada do aplicativo do ChatGPT para computador. Isso significa que, além de acessar o robô pela web ou pelo celular, será possível ter o ChatGPT instalado no PC.

O app será ativado com um comando simples que abrirá uma janela do GPT-4o no computador. O usuário poderá compartilhar a tela com a ferramenta e fazer perguntas, ou enviar informações e conversar com o sistema. A versão para macOS estará disponível a partir desta segunda-feira e a versão Windows será lançada até o fim do ano, segundo a OpenAI.

Os novos recursos de texto e imagem do GPT-4o já estão disponíveis no ChatGPT. As interações com voz serão lançadas "em breve", de acordo com a companhia.

Traduções e conversas em tempo real

Com o GPT-4o, a ferramenta irá funcionar com capacidades de fala que envolvem interações em tempo real. Na demonstração dos novos recursos, um executivo da OpenAI pediu conselhos para o ChatGPT para se acalmar em uma apresentação importante. O assistente de voz foi capaz de ouvir e analisar a respiração dele, depois oferecer sugestões sobre como seria possível melhorar:

— Uau, diminua um pouco o ritmo, Mark, você não é um aspirador de pó — brincou uma voz feminina do ChatGPT reformulado.

Executivos da OpenAI conversam em línguas diferentes com tradução em tempo real do ChatGPT — Foto: Reprodução/OpenAI
Executivos da OpenAI conversam em línguas diferentes com tradução em tempo real do ChatGPT — Foto: Reprodução/OpenAI

Antes do GPT-4o, os usuários já podiam enviar mensagens de voz para o ChatGPT. O robô, no entanto, demorava até 5,4 segundos para responder. Com a atualização, a ideia é que os usuários possam ter uma conversa fluida com a ferramenta. As respostas vão demorar, em média, 320 milissegundos para serem dadas, o que é "semelhante ao tempo de resposta humano em uma conversa", explica a empresa.

Uma das funcionalidades do sistema será a de realizar traduções e intermediar conversas em diferentes línguas. Durante o evento que apresentou o "novo" ChatGPT, Mira Murati falou em italiano com Mark Chen, um dos chefes de pesquisa da OpenAI:

— Tenho uma amiga aqui que só fala italiano e eu só falo inglês. Toda vez que você ouvir inglês, quero que traduza para o italiano e se você ouvir italiano, quero que traduza de volta para o inglês — pediu Mark ao ChatGPT, que funcionou como um intérprete na conversa entre os dois.

Além de multimodal, a OpenAI afirma que o GPT-4o é também multilíngue, com desempenho aprimorado em cerca de 50 idiomas.

ChatGPT vai ler emoções

Em outra demonstração, a equipe da OpenAI exibiu como ChatGPT agora será capaz de "enxergar" a partir da câmera do celular. Uma equação simples foi exibida e a IA foi capaz de dar conselhos de como resolvê-la.

O sistema também poderá interpretar emoções a partir de imagens. Durante o "Spring Update", Barret Zoph, diretor de Pós-Treinamento da OpenAI, abriu a câmera, sorriu para o ChatGPT e perguntou "que tipo de emoções" ele estava sentindo. Em um primeiro momento, o sistema o confundiu com uma "superfície de madeira", que tinha sido apresentada minuto antes. Depois, o robô se corrigiu:

Barret Zoph, da OpenAI, pede que ChatGPT  analise suas emoções — Foto: Reprodução/OpenAI
Barret Zoph, da OpenAI, pede que ChatGPT analise suas emoções — Foto: Reprodução/OpenAI

— Parece que você está se sentindo muito feliz e alegre, com um grande sorriso e talvez até um toque de entusiasmo. — respondeu a inteligência artificial. — O que quer que esteja acontecendo, parece que você está de ótimo humor.

A atualização também vai permitir que todos os usuários enviem imagens para o ChatGPT e peçam que ele analise o conteúdo, de documentos e tabelas a fotografias ou capturas de tela. Antes, apenas assinantes da ferramenta tinham essa possibilidade. "Por exemplo, agora você pode tirar uma foto de um menu em um idioma diferente e falar com o GPT-4o para traduzi-lo, aprender sobre a história e o significado da comida, e obter recomendações", conforme a OpenAI.

Outra possibilidade é de usar a capacidade de "visão" da IA para descrever objetos ou cenas de forma simultânea. Em uma das demonstrações da OpenAI, um usuário anda pela rua com o celular na mão e conversa com o ChatGPT, pedindo detalhes das cenas.

'Parece a IA dos filmes'

No futuro, a empresa pretende ir além com a capacidade de visão e voz do ChatGPT. "Por exemplo, você poderá mostrar ao ChatGPT um jogo de esportes ao vivo e pedir que ele lhe explique as regras", projeta a companhia.

"Parece a IA dos filmes. E ainda é um pouco surpreendente para mim que seja real", escreveu Altman em uma publicação feita em seu blog pessoal. Nas redes sociais, o executivo citou a refência cinematográfica do GPT-4o: o filme "Her", de 2013, em que um homem solitário se apaixona por um sistema operacional de inteligência artificial avançado.

"Ter o tempo de resposta em níveis humanos e expressividade é uma grande mudança", acrescentou o CEO da OpenAI. "É rápido, inteligente, divertido, natural e útil".

O anúncio da OpenAI acontece às vésperas do principal evento anual do Google, o Google I/O, que começa nesta terça-feira, em Mountain View, California. A rival liderada por Sundar Pichai deve apresentar novos recursos de inteligência artificial (IA) com o Gemini, concorrente do ChatGPT. Na semana que vem, a corrida de novidades de IA terá a largada ainda da Microsoft, que fará anúncios na área durante o Build 2024.

Mais recente Próxima Batalha global dos chips ganha fôlego com aumento de subsídios de US$ 81 bilhões
Mais do Globo

Mikel Merino deu a volta na bandeira de escanteio para homenagear o genitor após selar a vitória espanhola na prorrogação

Pai de 'herói' da Espanha na Eurocopa marcou gol decisivo contra alemães no mesmo estádio há 32 anos; compare

O craque aproveitou para agradecer pelo apoio da torcida

Cristiano Ronaldo faz publicação nas redes sociais após eliminação de Portugal na Eurocopa: 'Merecíamos mais'

Com os criminosos foram apreendidos drogas, dinheiro, máquina de cartão de crédito e diversos celulares roubados

Polícia Civil prende em flagrante três homens por tráfico e desarticula ponto de venda de drogas no Centro

Sem citar caso das joias, ex-presidente citou ‘questões que atrapalham’ e criticou a imprensa

Após indiciamento por joias, Bolsonaro é aplaudido em evento conservador ao dizer estar pronto para ser sabatinado sobre qualquer assunto

Embora Masoud Pezeshkian tenha sido eleito com a defesa do diálogo com nações ocidentais, decisões sobre política externa ou nuclear permanecem sob aiatolá Ali Khamenei

Vitória de candidato moderado no Irã pode aliviar, mas tensões nucleares não vão acabar, dizem analistas

Notícia foi dada pelo neto, Fidel Antonio Castro Smirnov

Morre Mirta Díaz-Balart, primeira mulher de Fidel Castro e mãe de um de seus filhos

Mãe da filha caçula do compositor, Claudia Faissol afirma ter sido companheira dele entre 2006 e 2017

Herança de João Gilberto: jornalista pede à Justiça reconhecimento de união estável com o gênio da Bossa Nova

Esse tipo de câncer surge de células que se desenvolvem nos músculos, sendo muito comum na infância; congestão nasal e olhos lacrimejantes estão entre os sintomas

O que é rabdomiossarcoma? Tumor que foi confundido com rinite e levou à morte de menino de 13 anos

Texto deve ser votado no segundo semestre e também prevê a "portabilidade" para motoristas trocarem de plataformas levandos as suas avaliações

PL dos Aplicativos: isenção de IPI para veículos, jornada máxima de 13 horas e filtro anti-assédio; veja pontos