As pessoas não podem ser as únicas guardiãs do conhecimento científico

A comunicação de resultados científicos em formatos desatualizados está a atrasar o progresso. Uma alternativa: traduzir ciência para máquinas.

Ilustração de papel caindo através de um olho digital em uma pilha organizada

Salve esta história
Salve esta história

logotipo

Banco de dados de IA →

Processamento de linguagem natural

Há uma velha piada que os físicos gostam de contar: tudo já foi descoberto e descrito numa das revistas russas da década de 1960, mas não sabemos disso. Embora esta piada seja hiperbólica, ela reflete com precisão a situação atual. O corpo de conhecimento é vasto e está crescendo rapidamente: em 2021, o número de artigos científicos postados no arXiv (o maior e mais popular servidor de pré-impressão) deverá atingir 190 mil – e isso é apenas uma fração da literatura científica criada este ano.

Obviamente, não sabemos realmente o que sabemos porque ninguém consegue ler toda a literatura, mesmo em seu campo restrito (que inclui, além de artigos de periódicos, dissertações de doutorado, notas de laboratório, slides, white papers, notas técnicas e relatórios). . É bem possível que as respostas a muitas perguntas estejam escondidas nesta montanha de documentos, que descobertas importantes sejam perdidas ou esquecidas e que as ligações permaneçam um mistério.

A inteligência artificial é uma solução potencial. Os algoritmos já conseguem analisar texto sem intervenção humana e encontrar conexões entre palavras que ajudam a revelar conhecimento. Mas muito mais pode ser alcançado afastando-se da escrita tradicional de artigos científicos, cujo estilo e estrutura permaneceram praticamente inalterados ao longo dos últimos cem anos.

Trabalhar com o texto apresenta uma série de limitações, incluindo acesso ao texto completo dos artigos e questões jurídicas. Mas o mais importante é que a IA não entende conceitos e conexões entre eles, e também é sensível a erros no conjunto de dados, como na seleção dos artigos analisados. Artigos científicos são difíceis de serem compreendidos pela IA – e até mesmo por leitores não especializados –, em parte porque diferentes disciplinas usam jargões diferentes e o mesmo termo pode ter significados completamente diferentes em campos diferentes. A crescente interdisciplinaridade da investigação significa que muitas vezes é difícil identificar um tópico utilizando uma combinação de palavras-chave para encontrar todos os artigos relevantes. Fazer conexões e (re)descobrir conceitos semelhantes é uma tarefa difícil mesmo para as mentes mais brilhantes.

INSCREVER-SE PARA
Assine o WIRED e fique atualizado com todas as suas ideias favoritas.

Embora isso seja assim, o II não pode ser confiável, e as pessoas terão que dobrar tudo o que emite a IA após o processamento do texto é uma tarefa tediosa que contradiz o objetivo do uso da IA. Para resolver esse problema, precisamos tornar os artigos científicos não apenas para a máquina, mas também o entendimento da máquina, reescrevend o-os para um tipo especial de linguagem de programação. Em outras palavras: ensinar carros à ciência em um idioma que eles entendem.

O registro do conhecimento científico em um idioma semelhante à linguagem de programação será seco, mas estável, porque novos conceitos serão adicionados diretamente à Biblioteca da Ciência, que é entendida por máquinas. Além disso, como as máquinas estudam cada vez mais fatos científicos, eles poderão ajudar os cientistas a otimizar argumentos lógicos, identificar erros, inconsistências, plágio e duplicação e enfatizar o relacionamento. A IA com entendimento das leis físicas é mais poderosa do que a IA treinada apenas em dados, portanto, as máquinas de alta tecnologia poderão ajudar futuras descobertas. Máquinas com profundo conhecimento no campo da ciência poderão ajudar mais do que substituir os cientistas-pessoas.

Os matemáticos já iniciaram esse processo de tradução. Eles ensinam computadores matemáticos, registrando teoremas e evidências em idiomas como Lean. Lean é um assistente de evidência e linguagem de programação, na qual você pode apresentar conceitos matemáticos na forma de objetos. Usando objetos conhecidos, Lean pode determinar se a afirmação é verdadeira ou falsa, ajudando os matemáticos a verificar evidências e identificar locais onde sua lógica não é rigorosa o suficiente. Quanto mais matemática Lean sabe, mais ele pode fazer. O projeto Xena no London Imperial College define o objetivo de apresentar todo o currículo em matemática para solteiros em Lean. Em um belo dia, os assistentes de evidências poderão ajudar os matemáticos em suas pesquisas, verificando seu raciocínio e procurando o vasto conhecimento matemático que eles possuem.

Mais popular
A ciência
Uma bomba demográfica de uma ação lenta está prestes a atingir a indústria de carne bovina
Matt Reynolds
Negócios
Dentro do complexo supe r-secreto Mark Zuckerberg no Havaí
Gatrine Skrimjor
Engrenagem
Primeira olhada em Matic, um aspirador de robô processado
Adrienne co
Negócios
Novas declarações de Elon Mask sobre a morte de um macaco estimulam novos requisitos para a investigação da SEC
Dhruv Mehrotra

Escrever matemática numa linguagem como Lean é talvez mais simples do que em outras áreas da ciência. É claro que nem todos os resultados científicos podem ser reescritos desta forma, mas muitos, especialmente nas áreas STEM, podem. Ao desenvolver uma nova linguagem, pode-se começar com algo como Lean e adaptá-lo adicionando recursos específicos de domínio. É claro que definir uma ideia científica requer não apenas matemática, mas também contexto, intuição e interpretação. É por isso que, embora a mecânica quântica tenha uma descrição matemática muito clara, existem inúmeros artigos e livros que tentam explicá-la. Transmitir estes aspectos subtis das ideias científicas às máquinas não será fácil, mas lembre-se que o verdadeiro propósito dos assistentes de máquinas é ajudar o cientista humano a refinar estes pontos mais profundos e a expressá-los de forma mais clara. Talvez seja precisamente porque alguns conceitos científicos desafiam a intuição humana que as máquinas serão capazes de compreender melhor o seu contexto.

Ainda temos que desenvolver esta linguagem comum entre humanos e máquinas, que provavelmente evoluirá e adquirirá vocabulários específicos de domínio. Mas quando o fizermos, não faltarão pioneiros. Como o projeto Xena mostrou, os membros da geração nativa digital podem aprender novas linguagens muito rapidamente, sem experiência prévia em programação. Para alguns cientistas, esta língua pode ser ainda mais fácil do que escrever prosa em inglês, que pode não ser a sua primeira língua. Isso os ajudará a estruturar melhor as ideias. Os tradutores podem traduzir o Lean de volta para a matemática e, da mesma forma, o novo idioma pode ser traduzido para o inglês ou qualquer outro idioma para não especialistas.

Traduzir a maior parte do conhecimento existente para máquinas é uma tarefa gigantesca, mas não impossível. Os cientistas são especialistas em criar novas formas de compartilhar informações, desde a World Wide Web até servidores de pré-impressão como o arXiv. Não é incomum imaginar cada cientista contribuindo para uma biblioteca de conceitos científicos traduzidos para máquinas. Tal como acontece com a matemática, outros currículos de graduação podem ser ensinados em máquinas por alunos que estudam essas disciplinas. Os estudantes de pós-graduação poderiam apresentar conceitos científicos relevantes ao seu tópico, e os pesquisadores poderiam registrar diretamente seus novos resultados no novo idioma.

Isto exigirá muito tempo e dinheiro, bem como um esforço coletivo. Mas poderá não haver outra forma de lidar com o volume cada vez maior de conhecimento científico: continuaremos a perder tempo e recursos a redescobrir conceitos conhecidos e a seguir caminhos sem saída. O futuro da ciência só pode residir no empreendimento homem-máquina.

Outras histórias interessantes da WIRED

  • As últimas notícias sobre tecnologia, ciência e muito mais: Receba nossas newsletters!
  • Parece uma pena: o lado negro do ouriço Instagram
  • As alterações climáticas tornam mais difícil escapar a catástrofes naturais
  • Sou motorista Lyft. Os passageiros agem como se eu fizesse parte do aplicativo
  • Covid criou um renascimento virtual para o desenho da vida
  • A indústria de inteligência artificial dos EUA corre o risco de se tornar um “vencedor e perdedor”
  • 👁️ Explore a IA como nunca antes com nosso novo banco de dados
  • 🎮 Jogos WIRED: últimas dicas, análises e muito mais
  • 🎧 Algo parece errado? Confira nossos fones de ouvido sem fio, barras de som e alto-falantes Bluetooth favoritos.
Rate article