Big Data pode não saber seu nome. Mas ela sabe tudo o mais

Os corretores de dados argumentam que os dados deidificados sobre milhões de americanos não são perigosos. Os legisladores devem saber que “anonimato” é uma abstração.

Salve esta história
Salve esta história

Empresas como ACXIOM, Lexisnexis e outras argumentam que não há nada terrível na coleta e na transferência dos dados confidenciais dos americanos se seus nomes e vários outros identificadores não forem atribuídos a elas. No final, eles argumentam, esses dados “anônimos” não podem ser associados a pessoas específicas e, portanto, inofensivas.

Mas, como eu já disse no Senado na semana passada, em princípio, você pode identificar qualquer coisa.”Anonimato” é uma abstração. Mesmo que a empresa não tenha seu nome (e provavelmente o possui), ela ainda pode obter seu endereço, a história da pesquisa na Internet, as revistas GPS do smartphone e outros dados para estabelecer sua identidade. No entanto, essa representação errônea e perigosa é preservada e continua a convencer os legisladores em detrimento da regulamentação efetiva da confidencialidade.

Dados sobre a raça, campo, etnia, religião, orientação sexual, crenças políticas, mecanismos de pesquisa na Internet, prescrições para drogas e coordenadas de GPS de centenas de milhões de americanos (e apenas alguns deles) são vendidos no mercado aberto e são Pronto para pagar muitos anunciantes, companhias de seguros, empresas de crédito, agências policiais dos EUA, golpistas e atacantes no país e no exterior (e isso é apenas alguns deles). O circo de corretores de dados praticamente não é regulamentado.

Muitos corretores argumentam que a regulamentação não é necessária, porque os dados que compram e vendem “não estão relacionados a indivíduos”, simplesmente porque não há, digamos, “nome” colunas com uma descrição detalhada da doença mental de milhões de americanos em sua planilha . Por exemplo, Experian, fornecendo informações sobre empréstimos ao consumidor, afirma que sua ampla troca de dados com terceiros inclui informações que “não são pessoais, deidificadas ou anônimas”. Yodlee, o maior corretor de dados financeiros dos Estados Unidos, afirma que todos os dados que vendem sobre os americanos são “anônimos”. Mas as declarações das empresas de que esse “anonimato” protege as pessoas de danos claramente não são verdadeiras.

Se inscrever
Inscrev a-se na Wired e mantenh a-se a par de todas as suas idéias favoritas.

Obviamente, há alguma diferença entre os dados com seu nome (ou número de seguro social, ou outro identificador claro) e dados sem ele. No entanto, essa diferença é pequena e é constantemente reduzida à medida que os conjuntos de dados estão se tornando cada vez mais. Lembr e-se de um fato engraçado sobre você: se você falar sobre o fato de que o Spaghetti Carbonar é seu prato favorito, uma audiência de 1000 pessoas, é bem possível que alguém nesta sala diga a mesma coisa. O mesmo se aplica à sua cor favorita, um lugar para viajar ou um candidato nas próximas eleições. Mas se você tiver que citar 50 fatos engraçados sobre si mesmo, a probabilidade de todos eles se relacionarem com outra pessoa cairá acentuadamente. Alguém, tendo recebido uma lista de 50 fatos, será capaz de rastrear esse mini-perfil antes de você.

Isso também se aplica a empresas com enormes matrizes de dados. Por exemplo, alguns grandes corretores de dados, como o ACXIOM, anunciam literalmente milhares ou dezenas de milhares de pontos de dados separados sobre uma pessoa em particular. Com essa latitude de cobertura (da orientação sexual e o nível de renda a cheques para compras e movimentos físicos no shopping, cidade ou país), o perfil coletivo de cada pessoa parece único. Nas profundezas (da Internet a revistas GPS 24 horas por dia de smartphones e dosagens de drogas), muitos pontos de dados individuais no perfil de cada pessoa também podem ser únicos. Para essas organizações e todos que compram, licenciam ou roubam esses dados, é muito fácil conectar tudo isso com pessoas específicas. Os corretores de dados e outras empresas também criam seus próprios dados, além do nome, para fazer isso, como, por exemplo, identificadores de publicidade móvel usados ​​para rastrear pessoas em diferentes sites e dispositivos.

A ironia é que os corretores de dados argumentam que seus dados “anônimos” não estão em risco, são simplesmente absurdos: todo o modelo de negócios e o movimento de marketing são baseados no pr é-requisito, que eles podem rastrear, rastrear e seletivos de maneira muito seletiva.

A identificação torno u-se terrivelmente simples. Em 2006, quando a AOL publicou uma coleção de 20 milhões de usuários da Web de 650. 000 usuários, nos quais os nomes foram substituídos por números aleatórios, o New York Times conectou rapidamente essas pesquisas com pessoas específicas.(Dois anos depois, pesquisadores da UT Austin, comparando as classificações “anonimizadas” de filmes de 500. 000 usuários da Netflix com IMDB, usuários identificados, bem como “suas óbvias preferências políticas e outras informações potencialmente importantes”. Das autoridades de Nova York, novamente, sem nomes, sobre cada viagem de táxi na cidade, elas não foram apenas capazes de rastrear códigos de hash mal gerados e identificar mais de 91 % do táxi, mas também classificar a renda dos motoristas.

A ironia é que os corretores de dados argumentam que seus dados “anonimizados” não estão em risco, são simplesmente absurdos: todo o modelo de negócios e a proposta de marketing são baseados na premissa, que eles podem monitorar, entender e seletivos cuidadosamente e seletivos.

Esse argumento não é apenas errado, mas também distrai a atenção. Não apenas essas empresas geralmente conhecem seu nome, mas os dados também não precisam conter o nome ou o número de seguro social para prejudicar. Empresas de crédito predatório e fornecedores de seguros médicos podem comprar acesso a redes de publicidade e operar segmentos vulneráveis ​​da população, sem previamente necessários em seus nomes. Os governos estrangeiros podem realizar campanhas de desinformação e propaganda nas redes sociais, usando os dados íntimos dos usuários dessas empresas, sem a necessidade de saber quem são essas pessoas. Os programadores não precisam de nomes em um conjunto de dados para criar ferramentas de inteligência artificial que não conseguem identificar com precisão os rostos de mulheres e negros ou ordenar que a polícia patrulhasse e tão intensamente patrulhável áreas de cores.

Mais popular
A ciência
Uma bomba demográfica de uma ação lenta está prestes a atingir a indústria de carne bovina
Matt Reynolds
Negócios
Dentro do complexo supe r-secreto Mark Zuckerberg no Havaí
Gatrine Skrimjor
Engrenagem
Primeira olhada em Matic, um aspirador de robô processado
Adrienne co
Negócios
Novas declarações de Elon Mask sobre a morte de um macaco estimulam novos requisitos para a investigação da SEC
Dhruv Mehrotra

Algumas soluções já estão sendo desenvolvidas, mas a maioria exige que os corretores de dados regulam suas atividades por conta própria. Estudos aparecem no campo dos métodos matemáticos para ocultar dados sobre uma pessoa, que podem reduzir o risco de vazamento ou aquisição ilegal de conjuntos de dados destinados a pessoas específicas. O Bureau do Censo, por exemplo, começou a adicionar uma quantidade estatisticamente calculada de ruído para ocultar os dados que ele coleta dos entrevistados. Isso também significa que uma pessoa que vê o conjunto de dados terá que fazer um determinado trabalho para expor indivíduos específicos. No entanto, o trabalho que deve ser feito para isso não é transcendente para evitar danos – e novamente, quando se trata de empresas que possuem um grande número de dados muito sensíveis sobre pessoas, os indivíduos são fáceis de calcular.

As empresas continuarão a insistir que pequenas alterações feitas em dados muito sensíveis e grandes matrizes de dados façam a coleta, agregação, análise, compra, venda e troca dessas informações. Parece que essas idéias convenceram muitos legisladores e já formaram algumas leis propostas sobre confidencialidade nas quais as empresas terão que fazer essas mudanças, mas, como resultado, por exemplo, elas podem ser isentas de obrigações para divulgar informações ou restrições na coleção. Muitos projetos de lei relativos à confidencialidade e dados, desde as contas de limitação da coleta de dados pela Comissão de Valores Mobiliários e Projetos de Rastreamento dos Contatos Covi d-19, são distinguidos entre dados que são “identificados pessoalmente” e aqueles que não são tal, e são Acreditava que essa diferença é suficiente para estabelecer restrições seguras. No entanto, todos os novos estudos e todos os novos exemplos de danos demonstram como é fácil identificar ou “r e-identificar” as pessoas na prática.

O Congresso deve pensar seriamente se vale a pena geralmente incluído na legislação federal sobre a proteção da vida privada a idéia de “informações anonimizadas” e “identificadas pessoalmente” se não estiver relacionada a métodos estatísticos específicos. Em vez disso, é melhor se concentrar nos tipos de dados e tipos de coleta e troca de dados, por exemplo, para proibir a venda de dados particularmente sensíveis, como a história da localização dos americanos no GPS, esse seria o melhor começo .

A opinião da Wired publica artigos de autores de terceiros, representando uma ampla gama de pontos de vista. Leia outras opiniões aqui, além de se familiarizar com nossas regras para enviar artigos aqui. Você pode enviar o artigo no site da opinião@wird. com.

Outras histórias de arame interessantes

  • 📩 As últimas notícias sobre tecnologia, ciência e muito mais: obtenha nossas correspondências!
  • 4 bebês mortos, mãe condenada e mistério genético
  • Seu jardim no telhado pode se tornar uma fazenda em baterias ensolaradas
  • Os robôs não eliminarão em breve a escassez de trabalhadores de armazém
  • Nosso horário inteligente favorito pode não apenas mostrar tempo
  • Hacker Lexicon: O que é um ataque de rega?
  • 👁️ Explore a IA como nunca antes com nosso novo banco de dados
  • 🏃🏽 As vezes querem obter as melhores ferramentas para manter a saúde? Veja a seleção dos melhores rastreadores de fitness, equipamentos de corrida (incluindo sapatos e meias) e os melhores fones de ouvido da nossa equipe de equipamentos.
Rate article