Para marcar a IA, ela precisa de seu próprio alfabeto

Está se tornando cada vez mais difícil distinguir o conteúdo criado pela inteligência artificial do conteúdo humano. Mas o Unicode oferece uma maneira elegante na corrida para marcar textos escritos por IA.

A colagem com a imagem de uma pessoa destacando o texto em uma folha de papel, zero e unidades e a marca d'água do estado

Salve esta história
Salve esta história

Há apenas alguns meses, o conteúdo gerado pela IA era fácil de reconhecer: entonações não naturais na fala, lóbulos das orelhas estranhos nas fotografias, linguagem de mau gosto na escrita. Este não é mais o caso. Em junho, golpistas usaram IA para imitar a voz de uma filha e roubar sua mãe. Os candidatos já estão usando deepfakes como propaganda. E os LLMs podem ajudar os spammers, automatizando as dispendiosas negociações necessárias para separar um sinal do seu dinheiro. Precisamos de uma maneira de distinguir coisas feitas por humanos de coisas feitas por algoritmos, e precisamos fazer isso muito em breve.

Uma forma universal de distinguir o conteúdo gerado por humanos do conteúdo gerado por IA resolveria muitas das preocupações que as pessoas têm sobre esta tecnologia emergente. Os consumidores de texto generativo poderiam “revelar a IA” para entender rapidamente o que foi escrito pela máquina. As empresas de software poderiam adicionar capacidades de marcação de IA aos seus produtos, o que mudaria a forma como o conteúdo é encontrado, substituído, copiado, colado e partilhado. Os governos poderiam concordar em comprar IA generativa apenas a empresas que rotulassem os seus produtos de uma forma que criasse incentivos de mercado significativos. Os professores poderiam insistir que os alunos deixassem as anotações intactas para aproveitar o poder da IA ​​generativa e, ao mesmo tempo, demonstrar a originalidade de seus pensamentos. E as marcas que desejam ser “transparentes em IA” podem prometer não remover a rotulagem, transformando os não-GPT nos novos não-OGM.

OPINIÃO COM FIO
SOBRE O SITE

Alistair Kroll é autor, empresário e organizador de conferências. Ele foi cofundador da startup de produção web Coradian, do acelerador Year One Labs e da conferência governamental digital FWD50. Ele presidiu a principal conferência mundial de ciência de dados e Strata, e atuou como executivo visitante na Harvard Business School. Alistair é autor de três livros sobre tecnologia e negócios, incluindo o best-seller Lean Analytics, e atualmente está trabalhando em Just Evil Enough, uma cartilha sobre pensamento disruptivo.

Felizmente, temos uma solução à nossa espera. Mas para compreender a elegância deste método relativamente simples, vejamos primeiro as alternativas e as razões pelas quais não funcionam.

Tanto os legisladores como as empresas tecnológicas concordam que a melhor forma de distinguir o conteúdo gerado pela IA do conteúdo produzido pelo homem é rotulá-lo no ponto de origem, algo que sete empresas tecnológicas se comprometeram a fazer como parte de um acordo anunciado pela Casa Branca no ano passado. . semana. Existem três abordagens principais para colocar marcas d’água em conteúdo digital. A primeira é adicionar metadados, algo que as câmeras vêm fazendo há décadas. Blocos de texto também são frequentemente marcados. Quando você digita algo em negrito ou define uma cor de fonte em um site, o processador de texto ou navegador marca seu conteúdo com metadados. Mas isso depende da aplicação específica: cole o texto em negrito na barra de endereço e a formatação desaparecerá.

As imagens digitais também podem receber marcas d’água usando esteganografia, que oculta criptograficamente uma mensagem dentro de outra. Foi usado pela primeira vez por espiões para contrabandear segredos, e agora existem muitas ferramentas que adicionam tags ocultas às imagens e depois rastreiam a Internet em busca de infratores de direitos autorais. A criptografia também funciona para marcas d’água. Você pode assinar digitalmente um parágrafo de texto e então determinar quando ele foi modificado, seja por meio de um sistema centralizado (Autoridade de Certificação Digital) ou distribuído (blockchain). É por isso que o filme que você comprou só toca no iTunes, mas o NFT que você esqueceu ainda pertence a você.

Mas estas abordagens têm três problemas fundamentais. Primeiro, exigem uma enorme coordenação. Por outro lado, uma boa solução de marcação de IA deve funcionar perfeitamente em bilhões de dispositivos. A marcação precisará ser capaz de suportar a cópia e colagem de um aplicativo, sistema operacional ou plataforma para outro. Em segundo lugar, qualquer solução deve estar disponível para qualquer pessoa com ligação à Internet, sem qualquer formação e de forma imediata. Deverá ser disponibilizado ao mundo através de uma atualização de software.

Mais popular
A ciência
Uma bomba-relógio demográfica está prestes a atingir a indústria da carne bovina.
Matt Reynolds
Negócios
Dentro do complexo ultrassecreto de Mark Zuckerberg no Havaí
Guthrie Scrimgeour
Engrenagem
Primeiro, dê uma olhada no Matic, o aspirador robô redesenhado
Adriane So
Negócios
As novas alegações de Elon Musk sobre a morte de macacos estimulam novas demandas de investigação da SEC
Dhruv Mehrotra

Em terceiro lugar, embora as marcas d’água funcionem muito bem com objetos grandes, como imagens, músicas ou capítulos de livros, eles não funcionam com objetos pequenos, como palavras ou letras separadas. Isso significa que essas abordagens não podem lidar com o conteúdo que combina as abordagens humanas e de máquinas. Se você possui um documento criado por inteligência artificial e, em seguida, editado por uma pessoa, precisa de uma marca d’água mais fina – um análogo digital de um marcador.

Isso pode parecer uma tarefa impossível. Mas, de fato, esse sistema já existe: Unicode.

O Unicode é um sistema de numeração universal para o texto, e o texto é o bloco de construção fundamental da Internet. No Unicode, cada símbolo tem seu próprio número. Por exemplo, a letra de título latina A possui um número 41 hexadecimal 41. Mas no unicode existem muitas outras letras A: letra maiúscula latina a (a a a a a a a a a a a a a a a a 𝐀 𝐀 𝐀 a a a a a a a a a 𝐀 𝐀 𝐀 a a a a a a a a a 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 𝐀 número de edição), número matemático de sans-serrif (𝖠, f0 9d 96 a0) e muitos outros . Cada letra A tem seu próprio nome, seu próprio valor unicode e, em alguns casos, sua própria fonte. Por que não criar a letra A especialmente para a IA?

Ao contrário dos metadados, que são anexados ao conteúdo, o valor do unicode é o próprio conteúdo. Se as empresas que precisarem ser aplicadas a sinais de água no local da IA ​​no local de sua origem serão usadas por um Unico – de fato, elas fornecerão seu próprio conjunto de personagens – receberemos uma marca d’água pronta e fina de IA da IA , que funcionará em todos os dispositivos, plataformas e sistemas operacionais e sites.

É importante observar que a marcação proposta não é um mecanismo de coerção. Os atacantes podem converter facilmente o texto da IA ​​para que pareça uma pessoa escrita por uma pessoa. O destinatário ainda deve confiar no remetente para acreditar no que é observado. Mas essa é uma das vantagens dessa abordagem. Assim que o texto estiver marcado, uma pessoa deve excluir ativamente o marcador de IA em algum momento entre o LLM e o consumidor. Temos mecanismos legais para investigação e combate a negligência ou ofensas. O protocolo proposto apenas nos permite aplic á-los à IA.

Obviamente, esse método tem suas próprias restrições. O número de espaço no unicode é limitado e há muitos idiomas que precisam ser suportados. Além disso, alguns programas para converter o texto em fala podem não ler as opções de um Unico em voz alta, o que torna este artigo incompreensível para aqueles que o ouvem. Tudo isso requer uma solução. Mas o Unicode oferece uma abordagem pronta, que já é generalizada. Nós o desenvolvemos para que todas as pessoas possam usar a Internet; Também podemos us á-lo para coexistir com a IA.

Além disso, as empresas que determinam o futuro do Unicode – o Unicode Consortium – muitos dos mesmos gigantes tecnológicos subjacentes à IA generativa, e três delas apenas prometeram aplicar marcas d’água à contagem da IA.

Temos rótulos para coisas que entramos em nosso corpo. Também devemos tomar cuidado para que colocemos em nossas mentes. Esta proposta é uma primeira etapa razoável, prática e não partidária ao longo deste caminho – uma etapa que pode alterar o modo de consumo de informações por bilhões de pessoas apenas com a ajuda da atualização do software.

A opinião da Wired publica artigos de autores de terceiros, representando uma ampla gama de pontos de vista. Leia outras opiniões aqui. Publique sua opinião no site idéias@wired. com.

Rate article