Sua agenda é uma história de detetive? Ou um relatório policial?

Toda visualização de dados tem uma história a ser desvendada, mas algumas são mais acessíveis que outras.

Colagem de imagens de lupa de microscópio e vários infográficos

Salve esta história
Salve esta história

As representações estatísticas modernas de dados – como grades de gráficos de dispersão para testar correlações – conseguem ser transparentes e destacar tendências nos dados. Em contraste, as visualizações de dados clássicas muitas vezes conseguem, paradoxalmente, ser um pouco opacas: um quebra-cabeça que o leitor deve resolver.

Consideremos uma visualização criada pelo designer de informação Will Bertin em 1951 para resumir a eficácia de três antibióticos – penicilina, neomicina e estreptomicina – no tratamento de 13 bactérias. Os tipos de bactérias estão dispostos em círculo, com três barras para cada infecção bacteriana indicando a quantidade de antibiótico necessária para tratá-la. A inversão da escala significa que as barras mais longas representam antibióticos mais eficazes, consistente com a interpretação espontânea “mais é melhor”, e o sombreado atrás das barras organiza nitidamente as bactérias em dois grupos, dependendo se o teste de coloração de Gram é positivo ou negativo.

Visualização de dados: WILL BERTIN

Na ciência, somos fascinados pela genialidade inesperada, que tentamos imediatamente sistematizar. O mesmo vale para a visualização: quando vemos um gráfico novo e revelador, queremos desmontá-lo e entender como funciona. O desenho sunburst de Burtin chama imediatamente a nossa atenção, despertando a curiosidade para entender a intenção por trás de seu formato de mandala. Sentimos o desejo de participar e até de celebrar as descobertas científicas que ela alude. O desenho circular também dificulta encontrar o melhor antibiótico para tratar uma determinada infecção ou perceber qualquer estrutura na relação entre bactérias e medicamentos. Mas para a maioria dos telespectadores, essas limitações só se tornam aparentes mais tarde, se é que o fazem.

Podemos comparar essa experiência com uma narrativa – uma lente através da qual muitas grandes (e não assim) obras de arte foram interpretadas. A narrativa envolve uma certa interação entre o enredo e a perspectiva, os eventos e a interpretação, a trama e os caracteres. Da mesma forma, a prática científica pode ser considerada como a interação entre dados e modelos. Dados são fatos. Os modelos são personagens cujas visões e suposições determinam o que tiramos da história. No nível mais simples, a escolha do método de visualização das estruturas de dados a percepção desses dados pelo espectador, incentivando algumas comparações sobre outras. Esta é a escolha do personagem, a escolha do modelo.

Opinião com fio
Sobre o site

Andrew Gelman é professor de estatística e ciências políticas da Universidade de Columbia. Seu último livro é “Regressão e outras histórias”. Jessica Hallman – Professora Associada do Departamento de Informática e Jornalismo da Universidade Nort e-Oeste. Sig a-a no Twitter em @jessicahullman.

Tal entendimento do design da visualização como uma forma de escolha de modelo, que enfatiza certas comparações, pode ser muito útil. Isso nos ajuda a repensar as visualizações e métodos existentes de exibição gráfica. Também nos ajuda a desenvolver visualizações mais eficazes para que possamos contar melhor nossas histórias.

A comparação implícita no gráfico da Bertina está focada em uma pergunta simples, talvez não surpreendente, dada o hype em torno dos antibióticos como os “milagres-eletricalidades” da época: que bactérias elas podem tratar? Observando as cores das tiras mais longas como o perímetro da varredura do círculo, usamos um gráfico para comparar antibióticos em sua eficácia. Para detectar essas supostas comparações, o espectador deve ingressar ativamente ao processo de descobertas, não semelhante ao que os cientistas que receberam os dados fizeram.

Muito foi escrito sobre como diferentes formas de narrativa estão envolvidas no leitor: desde a participação relativamente passiva do público do filme até a participação mais ativa daqueles que seguem o drama televisivo de várias partes e a experiência das pessoas Ler romances, que de certo modo devem criar filmes inteiros em sua cabeça.

Mais popular
A ciência
Uma bomba demográfica de uma ação lenta está prestes a atingir a indústria de carne bovina
Matt Reynolds
Negócios
Dentro do complexo supe r-secreto Mark Zuckerberg no Havaí
Gatrine Skrimjor
Engrenagem
Primeira olhada em Matic, um aspirador de robô processado
Adrienne co
Negócios
Novas declarações de Elon Mask sobre a morte de um macaco estimulam novos requisitos para a investigação da SEC
Dhruv Mehrotra

As visualizações de dados podem cair em diferentes lugares ao longo deste continuum. As histórias contadas por alguns deles são tão fortes e compreensíveis que não exigem nada de especial do espectador. Outros são muito mais exigentes. Pode-se traçar uma analogia com obras de arte que são mais ou menos acessíveis ao espectador, mas a diferença é que a arte de difícil acesso é muitas vezes deliberadamente ambígua, enquanto as representações complexas se destinam a ser compreendidas. Nesse sentido, as visualizações são mais parecidas com videogames do que com arte ou música. Eles criam uma experiência de tentativa e erro que lembra as abordagens de “aprendizagem ativa” estudadas por psicólogos educacionais.

Tal como acontece com os videogames, são as visualizações não convencionais que muitas vezes se mostram mais atraentes, mesmo para um público amplo. O desconhecido é mais difícil, e escolhas estéticas como o uso de formas agradáveis ​​e simetria podem motivar o espectador a tentar resolver o quebra-cabeça.

No entanto, representações cativantes não precisam ser tão visualmente exóticas quanto as de Burtin. Considere uma visualização recente e influente, o gráfico “Achatar a Curva”. Este diagrama chama a atenção do leitor com um enigma simples: a linha horizontal implica algum critério; nosso objetivo como espectadores é detectar a diferença entre uma curva que atenda a esse critério e uma curva que o exceda. Durante este processo, o argumento para o bloqueio aparece na forma de uma mensagem urgente embutida no gráfico. Embora os cientistas possam argumentar que a visualização não transmite quão imprecisamente foram estimadas a posição da linha e a forma das duas curvas, os seus criadores transmitiram exactamente o que pretendiam. Nenhum outro meio de comunicação social em circulação tem sido tão eficaz em abrir os olhos dos americanos para os resultados mais importantes das suas acções.

Visualização de dados: Sam Whitney; CDC
Mais popular
A ciência
Uma bomba demográfica de uma ação lenta está prestes a atingir a indústria de carne bovina
Matt Reynolds
Negócios
Dentro do complexo supe r-secreto Mark Zuckerberg no Havaí
Gatrine Skrimjor
Engrenagem
Primeira olhada em Matic, um aspirador de robô processado
Adrienne co
Negócios
Novas declarações de Elon Mask sobre a morte de um macaco estimulam novos requisitos para a investigação da SEC
Dhruv Mehrotra

Outra maneira popular de mostrar as consequências da pandemia é usar pontos de mudança para simular a disseminação da infecção. A animação criada pelo funcionário do Washington Post Harry Stevens ilustra o desenvolvimento do surto sob várias condições – desde a falta de precaução (“liberdade de ação”) até “ampla distância”. À medida que cada simulação é realizada, a área dobrada da região é preenchida diretamente acima dela com cor, proporcional ao número de infectados, infelizes e recuperados a cada momento. Observar como a simulação “constrói” o diagrama em tempo real é como ver alguém recolher um quebr a-cabeça. No entanto, no quebr a-cabeça, a imagem final que ele cria não está de forma alguma conectada ao processo pelo qual uma pessoa a resolve. Um quebr a-cabeça com visualização é uma questão completamente diferente: faz sentido apenas se uma pessoa entender o processo de conversão de dados em uma imagem.

Visualização de dados: Harry Stevens/Washington Post

O que é emocionante e não tradicional depende de nossas expectativas. Acredit a-se que a música seja atraente na medida em que equilibra a expectativa e a surpresa: a nota é interessante quando nos encontra de surpresa, mas também deve fazer sentido na estrutura do esquema geral do trabalho à medida que se desenvolve . O mesmo vale para a narrativa: as sensações agudas da surpresa só podem surgir ao se referir a alguma norma anteriormente existente (e durante sua violação). Portanto, a ciência também funciona – um processo em constante mudança de suposições, refutações e revoluções – uma história cheia de turnos.

Mais popular
A ciência
Uma bomba demográfica de uma ação lenta está prestes a atingir a indústria de carne bovina
Matt Reynolds
Negócios
Dentro do complexo supe r-secreto Mark Zuckerberg no Havaí
Gatrine Skrimjor
Engrenagem
Primeira olhada em Matic, um aspirador de robô processado
Adrienne co
Negócios
Novas declarações de Elon Mask sobre a morte de um macaco estimulam novos requisitos para a investigação da SEC
Dhruv Mehrotra

No entanto, na ciência, o público espera ouvir sobre os antecedentes primeiro, para que as expectativas possam ser formuladas antes de serem confusas. Para visualizações, esse processo geralmente está implícito. As expectativas surgem, em primeiro lugar, graças à escolha do modelo pelo designer e, em segundo lugar, graças à sua própria interpretação pelo público do significado dos padrões que eles viram.

A escolha do modelo do designer pode afetar quais aspectos do conjunto de dados ele decidiu enfatizar e como retrat á-lo. A apresentação dos dados na forma de um histograma causa uma comparação com formulários de referência familiares, como uma curva em forma de sino simétrica que ocorre em muitas estatísticas. O sistema visual humano é configurado para detectar desvios da simetria, o que torna os gráficos um excelente meio de identificar discrepâncias com o modelo.

Visualização de dados: Jessica Hallman

Ao escolher quais dados incluir e como transform á-los, a visualização, entre outras coisas, forma uma espera pelo espectador sobre a tendência ou as diferenças. Considere muitos gráficos lineares que descrevem casos de doença ou morte do Covid-19 ao longo do tempo para cada país. Independentemente de os dados serem transformados ou não (por exemplo, erguendo o logaritmo), a faixa dos eixos e o subconjunto dos países ativaram a criação de um contexto espacial e temporário, com base nos quais os dados são interpretados.

Mais popular
A ciência
Uma bomba demográfica de uma ação lenta está prestes a atingir a indústria de carne bovina
Matt Reynolds
Negócios
Dentro do complexo supe r-secreto Mark Zuckerberg no Havaí
Gatrine Skrimjor
Engrenagem
Primeira olhada em Matic, um aspirador de robô processado
Adrienne co
Negócios
Novas declarações de Elon Mask sobre a morte de um macaco estimulam novos requisitos para a investigação da SEC
Dhruv Mehrotra

Os gráficos mais eficazes antecipam e formam as expectativas. Independentemente de quão difícil é o cronograma, o mesmo princípio geral é válido. Construímos gráficos por dois motivos: descobrir a inesperada (“análise de pesquisa dos dados”, no jargão das estatísticas) e transmitir os resultados obtidos a outros. A análise de dados Exflairing funciona com base em modelos quase por definição – “inesperado” é determinado apenas através de expectativas. A comunicação também depende de expectativas, pois seu objetivo é dizer algo novo ou relatar as “notícias”. Apesar do fato de que as visualizações ocorrem no espaço, e música e histórias se desenrolam no tempo, todas elas dependem da mesma dinâmica, o equilíbrio de expectativas e surpresas. Mesmo a visualização mais comum e chata – por exemplo, um cronograma de pesquisas de opinião pública – deve pelo menos sugerir a oportunidade de descobrir algo imprevisto.

Cerca de 30 anos depois que Burtin criou seu gráfico, o conjunto de dados que ele visualizava mudou. Em 1984, os cientistas reclassificaram as duas bactérias, percebendo que o diplococcus pneumoniae (mostrado por volta das 11 horas no gráfico) era muito semelhante à bactéria estreptococo em sua resposta aos antibióticos testados, enquanto o streptococcus fecalis (mostrado entre 7 e 8 horas). ‘relógio) respondeu de forma muito diferente. outros estreptococos. Apesar da admiração que este gráfico recebeu na época, esses erros de alguma forma escaparam à atenção dos telespectadores.

Naturalmente, surge uma questão contrafactual: se Burtin tivesse traçado um gráfico estatístico mais simples do conjunto de dados – por exemplo, um histograma agrupado – talvez estes erros científicos tivessem sido descobertos mais cedo?

Esta é precisamente a questão sugerida pelos estatísticos Howard Weiner e Sean Leisen, que em 2009 publicaram um gráfico de dispersão mais tradicional, criado inicialmente por Lawrence Finer e Christian Ryan, para ilustrar esta questão. Embora Burtin tenha optado por se concentrar na comparação da eficácia dos antibióticos, o novo design prioriza a comparação de bactérias entre si. Os valores da estreptomicina são omitidos devido à sua estreita correspondência com os valores da neomicina. Bactérias do mesmo gênero têm uma cor comum. Duas bactérias mal rotuladas tornam-se suspeitas devido à correspondência de cores e à proximidade com outras bactérias: Por que o fecalis não está no canto superior esquerdo com os outros estreptococos? O que a pneumonia está fazendo aí?

Rate article