Código ao ar livre O algoritmo do Twitter é um arenque vermelho

A decisão amplamente anunciada de Elon Mask distraia a atenção de sua etapa recente para reduzir a transparência da plataforma.

Colagem de fotos do sinal obscuro do Twitter, Corida acenando uma capa vermelha e código de computador

Salve esta história
Salve esta história

Na sext a-feira passada, o Twitter postou o códig o-fonte de seu algoritmo de recomendações no Github. O Twitter disse que “abre o códig o-fonte” de seu algoritmo, e eu geralmente jogo por isso. Os algoritmos de recomendações e o códig o-fonte aberto são as principais áreas do meu trabalho como pesquisador e defensor responsável corporativo no setor tecnológico. Meus estudos mostraram por que e como empresas como o YouTube devem ser mais transparentes em relação ao trabalho interno de seus algoritmos recomendados, e eu conduzi campanhas chamand o-as para isso. A Mozilla, a organização sem fins lucrativos na qual sou pesquisadora sênior, abriu o código do navegador Netscape em 1998 e ofereceu uma comunidade de desenvolvedores em todo o mundo para contribuir com ele. Desde então, ela continua jogando pela internet aberta. Então, por que não é impressionante e não é agradável para a decisão da máscara?

De qualquer forma, o Twitter “Open Varsing”, tão chamado, é um arenque vermelho inteligente para distrair a atenção de seus passos recentes da transparência. Apenas algumas semanas atrás, o Twitter anunciou o fechamento da versão gratuita de sua API – uma ferramenta para a qual pesquisadores de todo o mundo são confiados há anos para pesquisas no campo de conteúdo nocivo, desinformação, saúde pública, monitoramento das eleições, comportamento político e muito mais. Agora, o uso dessa ferramenta custará aos pesquisadores e desenvolvedores de 42. 000 a 210. 000 dólares por mês. Esta etapa Twitter atraiu a atenção de legisladores e organizações da sociedade civil (incluindo a coalizão de pesquisas tecnológicas independentes no conselho da qual estou entrando), que condenou a decisão do Twitter.

Opinion Wired
Sobre o site

Brandy Gurkin – pesquisador sênior Mozilla. Ela é a criadora de YouTuberegrets, a maior da história do estudo de crowdsourcing do mecanismo consultivo do YouTube e sua influência na sociedade. Ela também é pesquisadora da Siegel Family Endowment Foundation e membro do Conselho da Coalizão de Pesquisa Tecnológica Independente.

A ironia é que muitas das questões levantadas pelas pessoas durante o fim de semana ao analisar o código-fonte poderiam, na verdade, ser verificadas pela própria ferramenta que o Twitter está desativando agora. Por exemplo, os pesquisadores sugeriram que o parâmetro “UkraineCrisisTopic” encontrado no código-fonte do Twitter era um sinal para o algoritmo rebaixar os tweets que faziam referência à invasão da Ucrânia. Usando a API do Twitter, os investigadores poderiam recuperar tweets relacionados com a invasão da Ucrânia e analisar o seu envolvimento para determinar se o algoritmo os impulsionou ou enfraqueceu. Essas ferramentas permitem ao público confirmar ou refutar de forma independente as informações fornecidas pelo código-fonte. Sem eles, estaremos à mercê do que o Twitter considera verdade.

A façanha do Twitter é apenas o exemplo mais recente de como a indústria tecnológica está a minar a transparência. Em 2020, o TikTok também usou as palavras “código-fonte” para surpreender os reguladores nos EUA e na Europa, que exigiam mais transparência nas operações da plataforma. Foi a primeira plataforma a anunciar a abertura de “Centros de Transparência” físicos, aparentemente projetados para permitir que “especialistas examinem e revisem as práticas do TikTok”. Em 2021, participei de um tour virtual pelo Centro, que foi pouco mais do que uma apresentação em Powerpoint dos funcionários da TikTok explicando como o aplicativo funciona e apresentando-lhes suas políticas de moderação de conteúdo, agora públicas. Três anos depois, os Hubs ainda estão fechados ao público (o site do TikTok cita a pandemia como o motivo), e o TikTok ainda não divulgou o código-fonte.

Se Musk realmente quisesse responsabilizar o algoritmo do Twitter, ele poderia torná-lo não apenas transparente, mas auditável. Por exemplo, ele poderia criar ferramentas que modelassem a saída de um sistema algorítmico com base em uma série de entradas. Isso permitiria aos pesquisadores conduzir experimentos controlados para testar como os sistemas de recomendação classificariam o conteúdo do mundo real. Tais ferramentas devem estar disponíveis para investigadores que trabalham no interesse público (e, claro, podem demonstrar como os seus métodos respeitam a privacidade das pessoas), com pouco ou nenhum custo.

Há boas notícias nesta frente: a lei européia sobre serviços digitais, que deve entrar em vigor para plataformas on-line muito grandes neste verão, obrigará as plataformas a conduzir uma auditoria de terceiros de seus algoritmos para garantir que eles não arrisquem dano às pessoas. Os dados que serão necessários para essa auditoria vão muito além do fato de o Twitter, o Tiktok ou qualquer outra plataforma fornecer atualmente.

O lançamento do códig o-fonte foi um passo ousado, mas apressado, para o qual o próprio Twitter não estava pronto: como a publicação do repositório do GitHub foi atualizada pelo menos duas vezes para remover fragmentos desconfortáveis ​​do código, que provavelmente nunca deveriam ter se tornado público público . Embora o códig o-fonte revele a lógica do sistema algorítmico, ele nos diz quase nada sobre como o sistema funcionará em tempo real, em tweets reais. A decisão de Elon não nos permite entender o que está acontecendo na plataforma agora e o que pode acontecer no futuro.

A opinião da Wired publica artigos de autores de terceiros, representando uma ampla gama de pontos de vista. Leia outras opiniões aqui, além de se familiarizar com nossas regras para enviar artigos aqui. Envie sua opinião para opinião@wird. com.

Rate article