Tecnologia
PUBLICIDADE
Por — São Paulo

Como o Google faz exatamente para definir qual site aparece primeiro em um resultado na busca é um segredo guardado há um quarto de século. Documentos internos da empresa vazados na semana passada, no entanto, jogaram luz sobre o que determina como os links aparecem em uma pesquisa — e mostram que a empresa faz aquilo que dizia não fazer.

O compilado de 2,5 mil documentos internos, que foram tornados públicos por dois profissionais de SEO (sigla para a otimização de mecanismos de buscas) dão detalhes dos dados coletados pelo Google para definir o ranqueamento de informações na busca. São mais de 14 mil fatores levados em consideração.

O material fornece pistas de como opera um dos algoritmos mais poderosos da internet, o que influencia o tráfego de audiência para fontes de informações e também a taxa de cliques que chega para as empresas — e que potencialmente é revertida em lucro e em vendas.

São ferramentas que determinam a vida ou a morte de sites. E influenciam a vida de bilhões de pessoas que procuram informações no Google.

Segundo Rand Fishkin, especialista em marketing digital responsável por publicar as informações do vazamento, os dados apontam contradições no que, durante anos, o Google publicamente apontava como fatores que determinavam o resultado das buscas.

‘Janela incompleta’

Um desses fatores é o uso de dados de navegação do Chrome para determinar o ranqueamento de sites. O Google sempre negou que usava esses dados para afinar a classificação de páginas no buscador. O vazamento, porém, mostrou que isso não é verdade.

A taxa de cliques (CTR, pela sigla em inglês) dos sites também pesa na ordem de exibição dos links, o que o Google negava.

— O que chama a atenção é que o Google sempre afirmou categoricamente que não utilizava dados do Chrome. Nós desconfiávamos porque frequentemente testamos os algoritmos — afirma Rosana Amaral, professora no curso de SEO da Escola Britânica de Artes Criativas e Tecnologia (EBAC).

Ela ressalta ainda que o mecanismo também, pela indicação dos dados revelados, privilegia sites grandes em detrimentos de sites pequenos.

O Google confirmou a autenticidade dos documentos vazados, mas ressaltou que era preciso ter cautela para não fazer “suposições imprecisas sobre a Busca com base em informações fora de contexto, desatualizadas ou incompletas.”

Carlos Affonso, diretor do Instituto de Tecnologia e Sociedade (ITS), faz um paralelo com a fórmula secreta de um produto: os documentos trazem elementos dela, mas não revelam toda sua composição, nem o processo de produção:

— É importante não comprar a ideia de que a “verdade foi revelada”, mas agora temos mais pistas. Abre uma janela, ainda incompleta, para entendermos como os sites são ranqueados. Se esses elementos forem verdadeiros, é importante a gente entender como eles podem favorecer determinados tipos de sites. E aí a principal preocupação é a desinformação.

Uma das preocupações das companhias é que, ao revelar as "fórmulas" dos algoritmos, explica Affonso, sites de desinformação usem isso para tirar vantagem desses mecanismos.

Isso é ainda mais preocupante depois que o Google passou a usar inteligência artificial (IA) nas buscas, oferecendo aos usuários um resumo do tema pesquisado e deixando os links em segundo plano. Sem os cliques que esse links na busca proporcionam, os sites não conseguem recursos e podem deixar de existir, o que levaria a um “deserto de informações” na internet, sem dados de fontes originais.

Fernando Ferreira, doutor em inteligência computacional e pesquisador do NetLab da UFRJ, avalia que a transparência sobre como as ferramentas de busca funcoinam "é crucial" para garantir a privacidade dos usuários e garantia de cumprimento das leis de proteção de dados.

— Isso também assegura um uso justo e transparente destas ferramentas por proprietários de sites, profissionais de marketing e usuários. Os dois primeiros precisam conhecer as regras para garantir seu tráfego online. Para os usuários, é importante saber como os dados são usados, para decidir se querem disponibilizá-los.

Quebra de confiança

As revelações rapidamente repercutiram entre empresas de marketing digital que dependem do algoritmo do Google para ajudar sites a aparecerem melhor na busca.

O CEO da iPullRank e veterano da indústria de marketing digital Michael King, um dos primeiros a analisar o material, disse à mídia americana que o vazamento traz a lição de que “o Google nos diz uma coisa e faz outra.”

Para Leonardo Foletto, pesquisador da Escola de Comunicação e Mídia (ECMI) da FGV, o vazamento levanta um debate sobre a transparência dos mecanismos e algoritmos do principal buscador da internet:

— Essas revelações são importantes porque, ao contradizer o Google, elas também nos trazem questionamentos sobre a credibilidade do que a empresa decide revelar. Talvez existam elementos que não estão claros sobre como funcionam os mecanismos de busca.

Para Rogério Salgado, fundador e diretor da Agência Explorer, as revelações marcam uma “quebra de confiança” em relação às diretrizes que a empresa apresenta ao mercado e as práticas que realmente adota:

— O mais relevante para mim é que talvez a gente não possa confiar nas próprias diretrizes do Google. Eles negavam utilização de CTR, dados do Chrome e autoridade do domínio, mas os documentos revelam que, sim, eles utilizavam (essas informações) — afirma Salgado.

Não está claro o quanto essas informações expostas são usadas pela empresa para definir a ordem em que os sites aparecem no Google. O material foi identificado primeiro por um usuário do Github, plataforma voltada para programadores de código. Não se sabe também, no entanto, se eles foram realmente expostos intencionalmente ou por acidente.

Vozes de crianças

Em meios aos debates sobre as novas informações das buscas, o Google também confirmou a autenticidade de outro vazamento, revelado pelo site especializado em tecnologia 404 Media. Os documentos, de 2,7 mil páginas, revelaram milhares de incidentes relacionados à privacidade dos usuários entre 2013 e 2018, incluindo um episódio em que endereços residenciais de usuários do Waze foram tornados públicos, e outro em que a empresa armazenou e transcreveu placa de carros em fotos do Google Street View.

Os documentos também mostram que a companhia acidentalmente gravou vozes de mil crianças no YouTube Kids. Segundo o banco de dados, um filtro que deveria interromper gravações de áudio de crianças “não foi aplicado corretamente”.

Os relatórios mostram que os incidentes foram reportados pelos funcionários do Google e depois corrigidos. Mas a empresa não divulgou isso na época.

Para Pedro Martins, coordenador da Data Privacy Brasil, as revelações abrem margem para questionamentos sobre o tratamento de dados dentro do Google:

— As informações podem gerar questionamentos sobre a legalidade das práticas da empresa, independentemente do erro. Ficou claro que foram erros que a empresa não queria cometer e que ela tentou resolver. Mas para além do erro, pode haver o questionamento se a prática é lícita, como transcrever informações do Street View.

Em nota, o Google afirmou que os relatórios obtidos pela 404 têm mais de seis anos e mostram como os funcionários da empresa rapidamente sinalizaram e consertaram os problemas.

Mais recente Próxima SpaceX obtém licença para lançar seu foguete Starship e prevê voo no próximo dia 6
Mais do Globo

Após show de stand-up em que comentou que era criticada por sua aparência, Punkie Johnson confirma que não estará na 50ª temporada do programa

Comediante que imita Kamala Harris 
deixa programa ‘Saturday Night Live’

Advogados do prefeito de São Paulo apontam 'artimanha' com objetivo eleitoral que atinge a honra do emedebista e pedem exclusão de vídeos publicados pela imprensa

Nunes pede inquérito contra mulher que o acusa de envolvimento com esquema em creches

Brasileira será a sexta ginasta a participar da final do salto em Paris, enquanto a americana será a quarta

Olimpíadas 2024: Rebeca Andrade vai saltar depois de Simone Biles na final deste sábado em Paris

Fortuna do fundador da Amazon encolheu US$ 15,2 bilhões com o recuo de 8,8% dos papéis

Mais ricos do mundo perdem US$ 134 bilhões com queda das ações de tecnologia, liderados por Bezos

Duelos começam na madrugada deste sábado na competição mista por equipes

Olimpíadas 2024: saiba como funciona a competição por equipes no judô e as chances do Brasil

Número de votantes que se encaixam nesse grupo cresceu 25% na comparação com o último pleito municipal, em 2020

Eleitorado de pessoas com deficiência bate recorde em 2024: mais de 1,4 milhão estão aptos a votar

Afirmação consta da defesa da magistrada Valéria Dacheux, da 6ª Câmara de Direito Privado, cuja conduta é alvo de apuração no Conselho Nacional de Justiça a partir de queixas da defesa de Regina Lemos

Desembargadora afirma que familiares de socialite têm interesses financeiros e não com o bem-estar da idosa

EUA só não serão adversários da seleção brasileira nas quartas se perderem para Porto Rico neste sábado

Brasil pode fazer terceiro confronto contra 'Dream Team' no basquete olímpico

As notas de comunidade são exibidas quando avaliadas como úteis por um número suficiente de usuários. O fato de ela ter saído do ar pode indicar nos bastidores uma disputa de votações

Plataforma X remove alerta sobre vídeo falso em post de Eduardo Bolsonaro com abraço de Celso Amorim e Maduro

Russos e bielorrussos competem em Paris-2024 sob a sigla de Atletas Neutros Internacionais

Eles foram ao pódio, mas são proibidos de aparecer no quadro de medalhas: entenda os atletas neutros, que conquistaram ouro nesta sexta