OpenAI, Google e outras empresas de tecnologia treinam seus chatbots com enormes quantidades de dados extraídos de livros, artigos da Wikipedia, notícias e outras fontes da internet. Mas, no futuro, elas esperam usar algo chamado de dados sintéticos.
- Análise: Como as gigantes de tecnologia usam atalhos para coletar dados para a IA
- Conheça a nova aposta da IA: 'Influenciadores' virtuais mais reais que os humanos
Isso porque as empresas de tecnologia podem esgotar o texto de alta qualidade que a internet tem a oferecer para o desenvolvimento da inteligência artificial. E as empresas estão enfrentando processos de direitos autorais de autores, organizações de notícias e programadores de computador por usarem seus trabalhos sem permissão. Em uma dessas ações, o New York Times processou a OpenAI e a Microsoft.
Eles acreditam que os dados sintéticos ajudarão a reduzir os problemas de direitos autorais e aumentarão o fornecimento de materiais de treinamento necessários para a IA. Veja abaixo o que você deve saber sobre isso.
O que são dados sintéticos?
São dados gerados pela inteligência artificial.
Isso significa que as empresas de tecnologia querem que a IA seja treinada pela IA?
Em vez de treinar modelos de IA com textos escritos por pessoas, empresas de tecnologia como Google, OpenAI e Anthropic esperam treinar sua tecnologia com dados gerados por outros modelos de I.A.
Os dados sintéticos funcionam?
Não exatamente. Os modelos de IA erram e inventam coisas. Eles também demonstraram que captam os vieses que aparecem nos dados da Internet com base nos quais foram treinados. Portanto, se as empresas usam a IA para treinar a IA, elas podem acabar ampliando suas próprias falhas.
O jogo dos seis erros da inteligência artificial
![O que foi informado ao sistema: imagem hiper-realista retrata um homem tirando uma selfie com os amigos em um cinema lotado. As pessoas assistem a uma comédia e riem muito — Foto: Imagem gerada por Midjourney](https://s2-oglobo.glbimg.com/iMoTPHt3O9ExJUHARME6INKXdCA=/0x0:689x529/648x248/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/O/g/0AfkXETSefvFzCYpVhBw/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma.jpg)
![O que foi informado ao sistema: imagem hiper-realista retrata um homem tirando uma selfie com os amigos em um cinema lotado. As pessoas assistem a uma comédia e riem muito — Foto: Imagem gerada por Midjourney](https://s2-oglobo.glbimg.com/TkhlvrytsKlogH0eXZY-fb4mPF0=/689x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/O/g/0AfkXETSefvFzCYpVhBw/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma.jpg)
O que foi informado ao sistema: imagem hiper-realista retrata um homem tirando uma selfie com os amigos em um cinema lotado. As pessoas assistem a uma comédia e riem muito — Foto: Imagem gerada por Midjourney
![No cinema. A figura que segura o celular tem as mãos deformadas — Foto: Imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/vqNfZeZZF1m0mGH_iEKNrYjqSow=/0x0:1316x915/323x182/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/Q/3/YOLFuJTWuG2HaoaVE25g/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma-1-.jpg)
![No cinema. A figura que segura o celular tem as mãos deformadas — Foto: Imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/x-Xn4bu1ktM76c625ZuiKkkWk38=/1316x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/Q/3/YOLFuJTWuG2HaoaVE25g/106073085-ec-credito-imagem-gerada-por-ia-midjourney-prompt-the-hyperrealistic-image-depicts-the-ma-1-.jpg)
No cinema. A figura que segura o celular tem as mãos deformadas — Foto: Imagem gerada por IA/Midjourney
Publicidade
![Harmonia: Um maestro conduz uma orquestra, rege com energia, a câmera está de costas para o maestro, os músicos estão de frente para a câmera, ele toca a Nona Sinfonia de Beethoven - Foto: imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/JGn0rzYKl56kvwjd40tgdu83Mr0=/0x0:788x605/323x182/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/w/w/WbJWvdQH6rEcsxxhBhzQ/106073097-ec-credito-imagem-gerada-por-ia-midjourney-prompt-a-conductor-leads-an-orchestra-conducts.jpg)
![Harmonia: Um maestro conduz uma orquestra, rege com energia, a câmera está de costas para o maestro, os músicos estão de frente para a câmera, ele toca a Nona Sinfonia de Beethoven - Foto: imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/jchLBnz4xv3Bk7rLH-0NfAtxGQg=/788x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/w/w/WbJWvdQH6rEcsxxhBhzQ/106073097-ec-credito-imagem-gerada-por-ia-midjourney-prompt-a-conductor-leads-an-orchestra-conducts.jpg)
Harmonia: Um maestro conduz uma orquestra, rege com energia, a câmera está de costas para o maestro, os músicos estão de frente para a câmera, ele toca a Nona Sinfonia de Beethoven - Foto: imagem gerada por IA/Midjourney
![Regência. A imagem exibe mão direita do maestro com dedo alongado. E a batuta se assemelha a um arco de violino — Foto: Imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/DZLWWJiGRqcfNaAAtDvy8PaSXFc=/1248x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/6/L/arZQ3aSguk4I4UnjeBBg/106073097-ec-credito-imagem-gerada-por-ia-midjourney-prompt-a-conductor-leads-an-orchestra-conducts.jpg)
Regência. A imagem exibe mão direita do maestro com dedo alongado. E a batuta se assemelha a um arco de violino — Foto: Imagem gerada por IA/Midjourney
Publicidade
![O que foi informado ao sistema de inteligência artificial: imagem exibe uma pessoa com os braços cruzados, não foi solicitado que aparecesse o rosto - foto: imagem criada por IA/Midjourney](https://s2-oglobo.glbimg.com/NRKfo0zYSxhP5Tf9WnLMjOQ5qWE=/625x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/P/q/XLsEZlQeOQQSVhw7lcwA/106073077-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-with-arms-crosse.jpg)
O que foi informado ao sistema de inteligência artificial: imagem exibe uma pessoa com os braços cruzados, não foi solicitado que aparecesse o rosto - foto: imagem criada por IA/Midjourney
![Em excesso. Imagem gerada por inteligência artificial mostra uma pessoa com mais um braço — Foto: Imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/_03jsUgiFSELbHOApAdOu0Szk3A=/1600x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/R/E/2Rz8DUTJA8EZNPyQCoEQ/106073077-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-with-arms-crosse.jpg)
Em excesso. Imagem gerada por inteligência artificial mostra uma pessoa com mais um braço — Foto: Imagem gerada por IA/Midjourney
Publicidade
![Alegria: Uma criança sorri imensamente feliz e até grita de boca aberta de tanta felicidade quando recebe um presente. Esta imagem serve como uma prova do poder da felicidade — Foto: Imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/wI8JxbOb8dcgOdtOZMMMPznBg5I=/1272x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/B/8/8rXBM7S5K4mld8A9KYiA/106073063-ec-dente1jpg-credito-imagem-gerada-por-ia-midjourney-prompt-a-child-smiles-immensely-happ.jpg)
Alegria: Uma criança sorri imensamente feliz e até grita de boca aberta de tanta felicidade quando recebe um presente. Esta imagem serve como uma prova do poder da felicidade — Foto: Imagem gerada por IA/Midjourney
![Sorriso assustador. O dente da criança que recebe o presente se confunde com a gengiva — Foto: Imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/AZmP2OoerFUa1c-QQ7A4C8Hrmhw=/1600x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/d/t/0mbdcPQcK2iBCko4ATCA/106073063-ec-dente1jpg-credito-imagem-gerada-por-ia-midjourney-prompt-a-child-smiles-immensely-happ-1-.jpg)
Sorriso assustador. O dente da criança que recebe o presente se confunde com a gengiva — Foto: Imagem gerada por IA/Midjourney
Publicidade
![Dueto inusitado: Produção exibe a cantora brasileira Anitta cantando com o líder do Coldplay, Crhis Martin, dançando e cantando no palco, com luz de neon — Foto: Imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/TOHoW1u2hh7JwrU9maiGjOmbbUY=/1000x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/i/m/sdP1QyQlCy3MhKLcoJ0g/106073079-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-production-still-of-a-brazilian-singe-1-.jpg)
Dueto inusitado: Produção exibe a cantora brasileira Anitta cantando com o líder do Coldplay, Crhis Martin, dançando e cantando no palco, com luz de neon — Foto: Imagem gerada por IA/Midjourney
![Atenção ao vocalista. A mão direita do cantor Chris Martin aparece com seis dedos — Foto: Imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/BcA_XwDkmnX0bgqhK_35uJQmVEQ=/1600x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/n/c/WGBKgDQw67slQEjTU0NQ/106073079-ec-credito-imagem-gerada-por-ia-midjourney.-prompt-production-still-of-a-brazilian-singe.jpg)
Atenção ao vocalista. A mão direita do cantor Chris Martin aparece com seis dedos — Foto: Imagem gerada por IA/Midjourney
Publicidade
![Apreciando a vista. Um grupo de capivaras com a cidade do Rio de Janeiro ao fundo, em um dia de garoa, imagem no estilo de publicações voltadas para a vida animal — Foto: Imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/czI_fBnJgzlc6905ED71t-s7Cw0=/1600x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/B/O/bp8KovREqBQ5Pvb5AGjg/106086327-production-still-a-hundred-capybara-the-city-of-rio-de-janeiro-in-the-background-rain-driz.jpg)
Apreciando a vista. Um grupo de capivaras com a cidade do Rio de Janeiro ao fundo, em um dia de garoa, imagem no estilo de publicações voltadas para a vida animal — Foto: Imagem gerada por IA/Midjourney
![É esse animal mesmo? Capivara aparece de rabo e mais parece um rato — Foto: Imagem gerada por IA/Midjourney](https://s2-oglobo.glbimg.com/ijWsS4rwau69tZ3V7M16bPt_YR4=/1304x0/smart/filters:strip_icc()/i.s3.glbimg.com/v1/AUTH_da025474c0c44edd99332dddb09cabe8/internal_photos/bs/2024/k/H/QAJqWJRlyhC5cEASVPCA/106086327-production-still-a-hundred-capybara-the-city-of-rio-de-janeiro-in-the-background-rain-driz-2-.jpg)
É esse animal mesmo? Capivara aparece de rabo e mais parece um rato — Foto: Imagem gerada por IA/Midjourney
Publicidade
Os dados sintéticos estão sendo amplamente utilizados pelas empresas de tecnologia atualmente?
Não. As empresas de tecnologia estão fazendo experiências com eles. Mas, devido às possíveis falhas dos dados sintéticos, eles não são uma grande parte da forma como os sistemas de IA são construídos atualmente.
Então, por que as empresas de tecnologia dizem que os dados sintéticos são o futuro?
As empresas acreditam que podem refinar a forma como os dados sintéticos são criados. A OpenAI e outras empresas exploraram uma técnica em que dois modelos diferentes de IA trabalham juntos para gerar dados sintéticos mais úteis e confiáveis.
Um modelo de IA gera os dados. Em seguida, um segundo modelo julga os dados, da mesma forma que um ser humano faria, decidindo se os dados são bons ou ruins, precisos ou não. Os modelos de IA são, na verdade, melhores para avaliar o texto do que para escrevê-lo.
— Se você der duas coisas à tecnologia, ela é muito boa em escolher qual delas parece melhor — disse Nathan Lile, executivo-chefe da start-up de inteligência artificial SynthLabs.
A ideia é que isso forneça os dados de alta qualidade necessários para treinar um chatbot ainda melhor.
Inteligência Artificial:
- Música, filmes, livros e artes visuais: Entenda como a inteligência artificial vai impactar o trabalho de criadores
- Marcha da IA: Conheça cinco das maiores inovações de inteligência artificial de 2023
- Inteligência artificial vai afetar quase 40% dos empregos, diz FMI
- Enquanto a IA voa, a regulação caminha lentamente. Veja os 17 pontos mais discutidos
- Dora Kaufman: ‘A criatividade ainda é um atributo humano’, diz pesquisadora de inteligência artificial
Essa técnica funciona?
Mais ou menos. Tudo se resume ao segundo modelo de IA.
Qual é a sua capacidade de avaliar o texto?
A Anthropic tem sido a mais explícita em seus esforços para fazer isso funcionar. Ela ajusta o segundo modelo de IA usando uma "constituição" selecionada pelos pesquisadores da empresa. Isso ensina o modelo a escolher textos que apoiem determinados princípios, como liberdade, igualdade e senso de fraternidade, ou vida, liberdade e segurança pessoal. O método da Anthropic é conhecido como "I.A. Constitucional".
Mesmo assim, são necessários humanos para garantir que o segundo modelo de IA permaneça no caminho certo. Isso limita a quantidade de dados sintéticos que esse processo pode gerar. E os pesquisadores discordam sobre se um método como o da Anthropic continuará a aprimorar os sistemas de I.A.
Os dados sintéticos ajudam as empresas a evitar o uso de informações protegidas por direitos autorais?
Os modelos de IA que geram dados sintéticos foram treinados com dados criados por humanos, muitos dos quais protegidos por direitos autorais. Portanto, os detentores de direitos autorais ainda podem argumentar que empresas como a OpenAI e a Anthropic usaram textos, imagens e vídeos protegidos por direitos autorais sem permissão.
Jeff Clune, professor de ciência da computação da Universidade da Colúmbia Britânica, que trabalhou anteriormente como pesquisador da OpenAI, disse que os modelos de IA podem se tornar mais poderosos do que o cérebro humano em alguns aspectos.
Mas eles farão isso porque aprenderam com o cérebro humano.
—Tomando emprestado de Newton: A I.A. enxerga mais longe por estar sobre os ombros de conjuntos de dados humanos gigantescos — disse ele.