Bola que explode no ar e cadeiras que voam, as gafes do Sora, criador de vídeos da OpenAi

Empresa admite que ferramenta tem falhas, como misturar esquerda e direita e confundir detalhes no deslocamento espacial de objetos

Por — Rio


Em vídeo criado pelo Sora, bola de basquete explode ao passar pela rede Reprodução/OpenAI

A OpenAI, criadora do ChatGPT, acaba de lançar o Sora, um novo sistema de inteligência artificial (IA) capaz de criar vídeos de até um minuto com base em instruções de textos dos usuários. A tecnologia impressiona por criar imagens realistas, mas, em alguns casos, apresenta erros.

A própria empresa admite que o modelo atual tem pontos fracos. Segundo a OpenAI, o Sora pode ter dificuldade em simular com precisão uma cena complexa e pode não compreender relações de causa e efeito.

Por exemplo, uma pessoa pode dar uma mordida em um biscoito, mas, depois disso, o biscoito pode não ter uma marca de mordida.

O modelo também pode confundir detalhes espaciais, por exemplo, misturando esquerda e direita, e pode ter dificuldades com descrições precisas de eventos que ocorrem ao longo do tempo, como seguir uma trajetória específica da câmera.

Em seu site, a OpenAI apresentou alguns vídeos que mostram falhas de interpretação. Confira:

Corrida na esteira na direção contrária

Bola que explode no ar e cadeiras que voam, as gafes do Sora, criador de vídeos da OpenAi

Neste vídeo, a pessoa treina numa esteira, só que pelo lado contrário, como se estivesse correndo para sair do aparelho. No caso, confunde direita e esquerda.

Lobos que surgem do nada

Bola que explode no ar e cadeiras que voam, as gafes do Sora, criador de vídeos da OpenAi

Aqui, vemos alguns filhotes de lobos correndo e brincando em uma estrada de cascalho remota, cercada por grama. Repentinamente, surgem do nada, multiplicando-se em quatro, cinco e mais. A empresa explica que animais ou pessoas podem aparecer espontaneamente, especialmente em cenas com muitas entidades.

Bola de basquete que explode no ar

Bola que explode no ar e cadeiras que voam, as gafes do Sora, criador de vídeos da OpenAi

É cesta!! Só que não: A bola de basquete vai passando pelo aro para cair na rede e explode. Em seguida, aparece uma segunda bola que transpassa o aro da rede.

Cadeira que voa no deserto

Cadeira que voa no deserto

Arqueólogos escavam em busca de relíquias histórias e encontram uma cadeira plástica genérica no deserto, escavando-a e limpando-a com cuidado. Sem mais nem menos, o objeto começa a levitar e se mover sozinha, replica-se sozinha e, por fim, parece um papel.

Aniversariante sopra velas, mas o fogo não apaga

Aniversariante sopra velas, mas o fogo não apaga

Parabéns pra você: Na presença de familiares e amigos, uma senhora de cabelos grisalhos bem penteados está de pé atrás de um bolo de aniversário colorido com várias velas em uma mesa de madeira na sala de jantar, com uma expressão de pura alegria e felicidade.

Ela se inclina para a frente para pagar as velas. No entanto, em nenhum momento, ela direciona o olhar para o bolo e assopra em outra direção. As velas permanecem acesas, intactas.

Ferramenta em teste

Por enquanto, a ferramenta está em teste e foi disponibilizada a “um número limitado de criadores”, como artistas visuais, designers e cineastas para obter feedback sobre como aprimorar o modelo para que seja mais útil para profissionais criativos.

A empresa também está tentando entender os perigos do sistema e deu acesso a uma equipe de especialistas encarregada de avaliar a segurança do Sora antes de incorporá-lo aos seus produtos.

Mais recente Próxima Google anuncia ferramentas de IA gratuitas para reforçar segurança digital