Novos emoji são tão chatos, mas eles não devem ser assim

O novo conjunto de dados sobre a popularidade do Emodi revelou o problema no processo de aprovação do Unicode, bem como uma maneira de resolv ê-lo.

Emoji com um rosto atencioso

Salve esta história
Salve esta história

Se você não gostou de emoji nos últimos anos, não está sozinho. Lanterna? Caixa de ferramentas? Extintor de incêndio? Lata? Quem os usa?

Emoji, que aparecerá no seu telefone no próximo ano, é tão chato. Ardósia, escova de dentes, pimenta búlgara … Sério, o que é, um shopping center? Quando você pensa em emoji, não pensa na lista de itens aleatórios. Você pensa nos rostos icônicos, às vezes estranhos e expressivos, como um rosto com lágrimas de alegria, um rosto atencioso, um diabo irritado, uma pilha sorridente de cocô e um macaco que não vê o mal, assim como sobre símbolos clássicos, como um polegar para cima e coração. Mas o último lote inclui apenas três rostos novos e uma nova forma da mão, além de 49 novos objetos, de patins e pedra a um vintuz.

A razão para este slide é irrelevante? O UNICODE Consortium – uma organização responsável por determinar os símbolos que devem ser reconhecidos por nossos dispositivos – no processo de aprovar novos emoji está cada vez mais medindo o que é necessário.

Se inscrever
Inscrev a-se na Wired e seja mais inteligente com seus autores favoritos de idéias.

Ninguém, é claro, vai codificar emoji chato. O Unicode tem três critérios principais, e um deles soa assim: “Existe alguma evidência significativa de que um grande número de pessoas provavelmente usará esse novo emoji”? Parece bom em teoria, mas o que é realmente uma “evidência significativa”? O Unicode não considera dados emoji obtidos de petições, patrocínio corporativo ou fontes de dados não públicas, acreditando que é muito fácil de manipular. Depois que o conjunto original de emoji recebido das operadoras de celular japonês foi codificado, o Unicode volto u-se para os resultados da pesquisa: se você se inscrever para criar um novo emoji, você deve fornecer capturas de tela mostrando quantas páginas da web foram encontradas ao procurar uma palavra ou frases conectadas No Google, Bing e Google Video Search, bem como no Google Trends.

A liderança oficial da Unicode observa que o emoji médio tem 500 milhões de resultados de pesquisa no Google comum, 25 milhões em Bing e 75 milhões na pesquisa de vídeo do Google. Embora “esses valores sejam fatores que são levados em consideração, e não com restrições rígidas”, o subcomitê de emoji, como regra, não se importa muito com o potencial emoji, que não se enquadra nessa área. Por exemplo, T. Rex, que, no entanto, se tornou emoji, corresponde ao limiar – o Google relata cerca de 554 milhões de páginas nas quais essa palavra é mencionada – enquanto o ictiossauro, que foi rejeitado, não está se aproximando dela (menos de um milhão).

Os resultados da pesquisa têm algumas vantagens. É mais difícil colocar o caminho para meio bilhão de resultados de pesquisa (embora não seja impossível) do que meio bilhão de assinaturas eletrônicas sob a petição. E, diferentemente do conjunto fechado de dados internos, a captura de tela do Google é fácil de verificar (você pode apenas repetir a pesquisa e procurar um número cinza diretamente acima da lista de links). Mas os resultados da pesquisa têm uma ótima desvantagem: as pessoas realmente criam sites sobre as mesmas coisas para as quais usam emoji?

Como uma pessoa que dedica um tempo sério para observar como as pessoas usam emoji nos últimos anos, eu não acreditava. Mas não pude provar isso até que um novo conjunto de dados Unicode aparecesse há algumas semanas: esta é uma lista pública de todos os 1. 468 emoji, classificados no número de pessoas usadas pelas pessoas.(Emodi 2018 e posterior foi excluído, porque eles não estão necessariamente amplamente disponíveis em todos os dispositivos, para que ainda não percebam seu potencial). A Unicode não especificou as fontes de dados – supõ e-se que elas sejam recebidas de grandes empresas tecnológicas, muitas das quais são membros da Unicode – mas disseram que os dados foram internacionais, nos últimos seis meses e são apresentados em uma escala logarítmica de acordo com a mediana para cada emoji de várias fontes para evitar distorções devido a emissões em uma plataforma.

Mais popular
A ciência
Uma bomba demográfica de uma ação lenta está prestes a atingir a indústria de carne bovina
Matt Reynolds
Negócios
Dentro do complexo supe r-secreto Mark Zuckerberg no Havaí
Gatrine Skrimjor
Engrenagem
Primeira olhada em Matic, um aspirador de robô processado
Adrienne co
Negócios
Novas declarações de Elon Mask sobre a morte de um macaco estimulam novos requisitos para a investigação da SEC
Dhruv Mehrotra

Não havia dados de dados comparáveis ​​no domínio público; Todo o resto é muito escasso. Postagens emojipedia em sua página inicial meia dúzia ou mais o melhor emoji de acordo com as consultas de pesquisa, que podem nos dar uma idéia de quando o novo emoji se torna realmente popular, mas não tem informações sobre o que está abaixo deste punhado. O emojitracker monitora o uso de emoji em tempo real no Twitter, o que parece maravilhoso até você entender que desde 2015, nenhum novo emoji apareceu no rastreador e que alguns emoji (por exemplo, um sinal de processamento para retweet) são muito mais populares em tweets de spam, do que em tweets de pessoas reais. Periodicamente, alguma empresa que tenta atrair a atenção das questões públicas é um comunicado de imprensa do emoji de 50 ou 100 top 100, geralmente de fontes misteriosas e unidas nas categorias misteriosas que não permitem estatísticas sérias. Para maior clareza, eu ainda me referi a eles, porque no meu livro sobre linguística da Internet, há um capítulo dedicado ao emoji, mas eles não eram rigorosos ou confiáveis ​​o suficiente para procurar tendências, exceto que os rostos, mãos e corações são invariavelmente as categorias mais populares .

Novas estatísticas nos permitem cavar mais fundo. Muitos dos emoji existentes mais populares não teriam passado de acordo com os critérios de pesquisa Unicode, se existissem naquele momento: um rosto sorridente com olhos sorridentes, um rosto com lágrimas de alegria, um rosto alto, um coração brilhante, uma berinjela , um mamilos sorridentes, o rosto do diabo, um macaco, um macaco, um macaco, um macaco não vendo mal, popper para uma festa, bíceps, um dedo cruzado e encolher de ombros. Nenhum deles chegou perto dos 500 milhões de resultados de referência ao pesquisar no Google, mesmo em 2019, quando esses resultados foram diluídos com muitas páginas sobre os próprios emoji – em vez disso, chegaram lá devido ao fato de estarem em telefones japoneses antes do unicode que ele começou tomar decisões. Por outro lado, muitos emoji que atendem aos critérios da busca, desde o momento da aparência, definham muito mais baixo que o nível médio de popularidade: scooter, pylet com um phalafel, rinoceronte, uma lata de lata com comida, casaco, bobslei, bacalhau, luvas, vampiro, zebra, zebra, zebra, zebra. ouriço, estrela do rock/cantor e astronauta.

É claro que, às vezes, os resultados coincidem: o coração vermelho, o coração – eye, o fogo, um balão, o polegar para cima e um rosto atencioso – todos são muito populares como os resultados da busca e como um emoji. E, é claro, os critérios de pesquisa tornaram possível excluir vários candidatos verdadeiramente incompreensíveis.(T. Rex é muito bem adequado como emoji e como resultado da pesquisa, mas duvido que o iciossauro teria atingido a mesma popularidade). Mas, em geral, o uso dos resultados da pesquisa para prever o uso de emoji é, se você usar um idioma, uma comparação de emoji da maçã com laranja.

Mais popular
A ciência
Uma bomba demográfica de uma ação lenta está prestes a atingir a indústria de carne bovina
Matt Reynolds
Negócios
Dentro do complexo supe r-secreto Mark Zuckerberg no Havaí
Gatrine Skrimjor
Engrenagem
Primeira olhada em Matic, um aspirador de robô processado
Adrienne co
Negócios
Novas declarações de Elon Mask sobre a morte de um macaco estimulam novos requisitos para a investigação da SEC
Dhruv Mehrotra

O ponto não é apenas que emoji, aprovado de acordo com novos critérios, teve menos tempo para ganhar popularidade, porque outros emoji apresentaram nos mesmos anos rapidamente ganharam popularidade, por exemplo, um rosto ou rosto atencioso cercado por corações. É mais provável que os conceitos sejam codificados em emoji. O uso dos resultados da pesquisa nos inclina para o substantivo comum – por isso obtemos rinocerontes, casacos de pele, vampiros e código. Mas as pessoas geralmente não usam emoji como substitutos para substantivos. Eles podem, mas não usam. Em vez disso, os emoji são usados ​​além das palavras como uma maneira de fornecer um contexto, emoções ou ilustrações adicionais, assim como usamos gestos junto com o tipo físico de linguagem, e isso é especialmente bom para rostos, braços e corações.

Cinco ou dez anos atrás, nas primeiras edições do Unicode, não sabíamos como (e em geral, se começaria a usar emoji. Talvez fosse apenas um chip japonês, talvez as pessoas realmente as inserissem no meio das frases em vez de palavras ou usassem emoji para as mesmas coisas que fazem sites. Mas agora, quando temos esses dados, e espero que seja por isso que a Unicode o lançou, podemos adicion á-los como um contrapeso útil para pesquisar dados quando as pessoas oferecem mais novos emoji. Por exemplo, se alguém quiser oferecer emoji para uma nova peça de roupa (digamos, pijamas), ele não só pode ver como a palavra “pijama” está se movendo em busca em si, mas também compar á-la com a popularidade do emojes existentes para roupas.

Então, que tipos de emoji devemos esperar que haja mais e quais, se o Unicode começar a levar em consideração a popularidade do emoji existente? Para descobrir, enviei o conjunto de dados Unicode sobre a frequência de uso de emoji, marquei todo o emoji por categorias (acho que agora essa prática é chamada de “ensino da rede neural”) e calculei alguns dados estatísticos.

Usei minhas próprias categorias porque estava interessado em diferenças mais sutis do que elas geralmente se encontravam no teclado emoji: rostos tradicionais redondos, como lágrimas de alegria e raiva, eram diferentes;”Rostos estranhos” com as expressões de outros personagens, por exemplo, o emoticon do diabo, um gato com coração a coração ou um macaco que não vê o mal; Pessoas em certas poses, por exemplo, uma pessoa ou dançarina encolhendo os ombros; Pessoas sem uma certa pose ou expressão representando arquétipos, por exemplo, vermelho ou astronauta; E grupos de pessoas, por exemplo, todos os diferentes casais e famílias.

Mais popular
A ciência
Uma bomba demográfica de uma ação lenta está prestes a atingir a indústria de carne bovina
Matt Reynolds
Negócios
Dentro do complexo supe r-secreto Mark Zuckerberg no Havaí
Gatrine Skrimjor
Engrenagem
Primeira olhada em Matic, um aspirador de robô processado
Adrienne co
Negócios
Novas declarações de Elon Mask sobre a morte de um macaco estimulam novos requisitos para a investigação da SEC
Dhruv Mehrotra

Eu também queria ter uma idéia do intervalo em cada categoria. É fácil observar o nível de popularidade e observar que existem muitos rostos nos grupos superiores e, nos grupos inferiores, existem muitas bandeiras e personagens. Mas todos os rostos são populares e todos os símbolos são impopulares, ou vários desvios distorcem nossa percepção de todo o grupo?

Para descobrir, calculei cinco indicadores estatísticos para cada categoria: o nível dos emoji mais e menos populares, o nível de emoji com popularidade precisamente média (mediana), bem como o nível de emoji, que eram populares por 25 e 75 % (primeiro e terceiro tênios). Isso significa que cada caixa contém metade do emoji nesta categoria – aqueles que são agrupados acima e abaixo do nível médio de popularidade, e as linhas do lado de fora mostram a outra metade da categoria – aquelas que estão mais distantes da mediana. Se o campo for pequeno e as linhas são curtas, pois, por exemplo, em animais, então emoji nesta categoria terá um nível de popularidade muito estável. Se o campo for grande ou longa, por exemplo, com pessoas em poses diferentes, os emoji nesta categoria terão um nível de popularidade muito diferente.

Abaixo apresento um gráfico dessas estatísticas em ordem decrescente de sua mediana.

Gráfico: Gretchen McCulloch/WIRED
Mais popular
A ciência
Uma bomba demográfica de uma ação lenta está prestes a atingir a indústria de carne bovina
Matt Reynolds
Negócios
Dentro do complexo supe r-secreto Mark Zuckerberg no Havaí
Gatrine Skrimjor
Engrenagem
Primeira olhada em Matic, um aspirador de robô processado
Adrienne co
Negócios
Novas declarações de Elon Mask sobre a morte de um macaco estimulam novos requisitos para a investigação da SEC
Dhruv Mehrotra

O Unicode também nos ajuda a determinar o nível médio de popularidade dos emojis em geral (de 1. 468 emojis, estes são os que estão abaixo do número 735 em popularidade), que tracei como uma linha pontilhada no gráfico. O meio parece bem baixo porque há muitas bandeiras e a maioria delas não é muito popular, mas como um órgão de padrões internacionais, o Unicode deveria ter codificado todas as bandeiras dos países ou nenhuma. No entanto, para nossos propósitos, isso significa que quando outras categorias de emojis ficam abaixo da mediana, não é um bom sinal. Então, com isso em mente, podemos ver que provavelmente não vale a pena adicionar emojis de roupas por um tempo: a média dos emojis de roupas já está abaixo da média. Desculpe, pijama. Da mesma forma, novo emoji de transporte? Idéia ainda pior.

Corações, emojis e gestos manuais são de facto os mais populares, o que confirma os resultados obtidos em conjuntos de dados menos abrangentes: todos os representantes destas categorias pontuaram acima da média.(Divulgação: notei que os emojis de mão estavam superando suas posições em conjuntos de dados mais completos sem criar muitas frases novas enquanto eu escrevia Porque a Internet, então já comecei a escrever frases para novos, vários dos quais estão atualmente em revisão pelo Consórcio Unicode).

Pessoas com uma expressão emocional de algum outro personagem (“rostos estranhos”), como um macaco-vizho-não-out 🙈, gato-hearteem 😻 e uma pilha sorridente de cocô 💩, também são muito bons: são todos, exceto o Cabeça da Ilha de Páscoa 🗿, obteve mais do que a pontuação média entre emoji.(Também é discutível se o chefe da ilha da Páscoa pertence a essa categoria). No entanto, recentemente, o UNICO não codificou rostos mais estranhos, preferindo codificar pessoas com uma expressão neutra em seus rostos/aparência (“tipo de homem”, por exemplo, com raça vermelha ou astronauta) ou em certas poses (“humano pose “, por exemplo, um dançarino ou esquiador). A aparência e as poses são facilmente exibidas nos resultados da pesquisa, mas são muito menos populares em uso real do que rostos difíceis e estranhos do conjunto japonês original de emoji.

Uma das surpresas – as plantas são muito mais populares que os animais, apesar do fato de que, nos últimos anos, há muito mais do que plantas. Até os emojes vegetais mais baixos são geralmente mais altos que a mediana, mas em geral são quase tão populares quanto gestos das mãos. Comparado a isso, os emoji de animais estão mais próximos da mediana – principalmente eles ainda são mais altos que ela, mas alguns caem abaixo. Além disso, se virmos quais emoji são mais populares entre as plantas, descobriremos que são todas flores. Precisamos passar por sete tipos diferentes de cores antes da próxima planta de popularidade – grama 🌿. Talvez isso não seja tão incrível quanto parece à primeira vista. As flores têm uma longa história de uso simbólico, e o emoji floral mais popular é uma rosa 🌹, que tem duplo simbolismo – romance e socialismo. Não quero parecer muito milenar, mas isso sugere que, além do cacto, pode haver emoji suculento.(A propósito, na categoria de animais, aqueles que são retratados na forma de uma face, e não um corpo inteiro, que novamente contradiz as últimas tendências da codificação de unicode).

Rate article