Fake News 2.0: a IA em breve poderá imitar qualquer voz humana

A maior perda causada pela inteligência artificial será a completa destruição da confiança em tudo que você ouve ou vê

Créditos: Rami Niemi

Em 2018, o medo das notícias falsas será ínfimo comparado ao das novas tecnologias capazes de imitar a voz humana. Isso poderia criar pesadelos de segurança. Pior ainda, poderia tirar de nós parte de nossa singularidade. Mas empresas, universidades e governos já estão trabalhando furiosamente para decodificar a voz humana para muitas aplicações. Estas vão desde maior integração aos dispositivos da internet-das-coisas até a viabilização do diálogo natural entre humanos e máquinas. Países mais adeptos da tecnologia (os EUA, China e Estônia) entraram nesse espaço, e gigantes do tech como o Google, Amazon, Apple e o Facebook também têm projetos especiais relacionados à voz.

Não é tão difícil desenvolver uma voz artificial, depois modelar e reproduzir palavras e frases faladas. Era admirável ouvir um Apple Macintosh informando a data e a hora em um tom seco e digital. Criar uma voz que soa natural envolve algoritmos muito mais complexos e caros. Mas essa tecnologia está disponível agora.

Como qualquer patologista de voz atestará, a voz humana é muito mais do que vibrações das cordas vocais. Essas vibrações são causadas pelo ar que escapa de nossos pulmões, forçando a abertura de nossas membranas vocais, um processo que produz tons tão únicos quanto impressões digitais, por conta das milhares de comprimentos de onda que são criados simultaneamente e em coro. Mas a singularidade de uma voz também está ligada a características que raramente consideramos, como a entonação, a inflexão e o ritmo. Esses aspectos de nossa fala dependem da situação, são frequentemente inconscientes e fazem toda a diferença para o ouvinte. Eles nos contam quando uma frase como, “Uau, essa roupa é demais!” deve ser interpretada como maldosa, sarcástica, amável ou indiferente. Esse desafio explica o uso desde o começo de emojis em mensagens de texto. Eram necessários para clarificar a intenção por trás da mensagem escrita porque é extremamente difícil interpretar o significado real do escrito comparado ao que é dito.

Detalhes como intonação, inflexão e ritmo são particularmente difíceis de modelar, mas estamos chegando lá. O projeto Voco da Adobe está desenvolvendo o que seria, essencialmente, um Photoshop das ondas sonoras. Funciona com a substituição de ondas por pixels, para produzir algo que soa natural. A companhia está apostando que, se o suficiente da fala de uma pessoa puder ser gravado (ou adquirido), precisará de um pouco mais do que uma ação de copia-e-cola para alterar a gravação daquela voz. Os resultaods iniciais do Voco são assustadores, assim como impressionantes. O poder do protótipo indica o quão cedo cidadãos comuns serão incapazes de distinguir entre vozes reais e adulteradas. Se você tiver trechos o suficiente armazenados, poderá fazer qualquer um falar praticamente qualquer coisa.

As empresas de tecnologia e seus investidores estão apostando na ideia de que esses sistemas terão tremendo valor comercial com o tempo. Mesmo antes dessa situação surgir, no entanto, esse tipo de tecnologia já apresentará grandes riscos. Em 2018, um indivíduo nefasto poderá ser capaz de criar uma imitação vocal boa o suficiente para enganar, confundir, irritar ou mobilizar o público. A maior parte dos cidadãos no mundo serão incapazes de discernir entre um Trump ou Putin falsos e suas figuras reais.

Quando considera-se a desconfiança ampla na mídia tradicional, instituições e especialistas em suas áreas, a falsidade dos áudios poderá causar um grande estrago. Poderia começar guerras. Imagine as consequências do áudio manufaturado de um líder mundial fazendo discursos bélicos, apoiados por um vídeo fabricado. Em 2018, os cidadãos – ou generais militares – poderão determinar o que é falso?

Traduzido do site Wired.

A "Splinternet" pode ser o futuro da web

Tanto o The Economist quanto o WIRED estão preocupados sobre a “splinternet”. A organização de pesquisa britânica NESTA acredita que ela poderia “partir” a internet como a conhecemos.

O que é essa ideia de nome esquisito? É o conceito de que a experiência da internet de alguém na Turquia, por exemplo, esteja se tornando cada vez mais diferente da experiência na internet de alguém na Austrália.

Quem viaja para a China, especialmente, já está familiarizado com esse fenômeno. Graças ao controle rígido do governo, precisam usar o Baidu ao invés do Google para fazer pesquisas, e não conseguem acessar o Facebook ou sites de notícias como o The Economist e o New York Times.

Temos uma splinternet crescente por conta dos bloqueios regionais de conteúdo e a necessidade das empresas de obedecer decisões judiciais, políticas e regulamentos nacionais diversos e muitas vezes conflitantes.

A tensão fica especialmente aparente quando tratamos de sites como o Google, Facebook e Twitter. Estas plataformas têm usuários em quase todos os países, e governos estão cada vez mais insistindo que obedeçam a leis locais e normas culturais quando o assunto é acesso ao conteúdo.

A internet nunca foi realmente aberta

A ideia da internet como uma plataforma independente, global e desregulada sempre foi, de certa forma, ficção. Até mesmo no ápice da retórica tecnofuturista de que havia potencial de transcender fronteiras nacionais no fim dos anos 90, sempre houveram exceções.

O Partido Comunista Chinês entendeu desde o começo que a internet era simplesmente uma nova forma de mídia, e o controle da mídia era fundamental para a soberania e autoridade nacionais.

Mas a splinternet se refere a uma tendência mais ampla de usar leis e poderes regulatórios em jurisdições territoriais para definir limites nas atividades digitais.

Edward Snowden. Fonte da imagem: LeStudio1 – 2017/ Flickr Commons.

Um momento definitivo foram as revelações de Edward Snowden em 2013. Os documentos que ele compartilhou sugeriam que a Agência Nacional de Segurança dos EUA, através do programa PRISM, estava coletando informações de usuários de todo o mundo do Google, Facebook, Apple, Microsoft e Yahoo!.

Em países como o Brasil, cujos líderes tiveram suas comunicações interceptadas, isso acelerou movimentos que desenvolvessem o controle nacional da internet.

A lei do Marco Civil da Internet, por exemplo, agora requer que empresas multinacionais obedeçam leis brasileiras quanto à proteção de dados.

Isso é algo ruim?

Até agora, boa parte da atratividade da internet advém do fato de que ela é conduzida pelo conteúdo e preferências dos usuários, e não por governos.

Mas as pessoas estão prestando mais atenção aos discursos de ódio, abusos direcionados no meio online, extremismo, notícias falsas e outros aspectos tóxicos da cultura online. Mulheres, negros, seguidores de certas religiões e os LGBT são alvos em frequências desproporcionais.

Acadêmicos como Tarleton Gillespie e figuras públicas como Stephen Fry são parte de uma crescente rejeição à resposta típica de provedores: de que são “apenas empresas de tecnologia” – intermediários – e não podem se envolver diretamente na regulamentação de discursos.

Um relatório da Câmara de Provisões do Reino Unido sobre “crime de ódio e suas consequências violentas” apontou que:

…há uma grande quantidade de provas de que essas plataformas estão sendo usadas para espalhar ódio, abuso e extremismo. Esta onda continua a crescer em velocidade alarmante, mas continua não sendo verificada e, mesmo onde isso é ilegal, não há policiamento.

Se dizemos que o discurso de ódio “deveria ser policiado”, duas perguntas óbvias surgem: quem faria isso e qual seria o referencial?

Atualmente, o conteúdo de grandes plataformas é gerenciado em grande parte pelas próprias empresas. Os Arquivos do Facebook do The Guardian relevaram tanto a extensão quanto as limitações desta moderação.

Talvez vejamos os governos se tornando cada vez mais dispostos a entrar no jogo, fragmentando ainda mais a experiência dos usuários.

Fair play para todos

Há outras preocupações em jogo em relação à splinternet. Uma é a questão da equidade entre empresas de tecnologia e a mídia tradicional.

Marcas como Google, Apple, Facebook, Microsoft, Netflix e Amazon estão eclipsando os gigantes tradicionais da mídia, embora filmes, a televisão, jornais e revistas ainda sejam submetidos a níveis consideravelmente maiores de regulamentos específicos de um país e escrutínio público.

Por exemplo, empresas comerciais de televisão na Austrália devem obedecer regulamentos de produções nacionais e conteúdo infantil. Estes não se aplicam ao YouTube ou Netflix, apesar do público e comerciantes estarem migrando para estes provedores.

Está cada vez mais aparente aos desenvolvedores de políticas midiáticas que os regulamentos existentes não são significativos a não ser que se estendam ao espaço online.

Na Austrália, a Revisão de Convergência de 2012 procurou lidar com essa questão. Ela recomendou que os regulamentos midiáticos deveriam se aplicar a “Empresas de Serviço e Conteúdo” que alcançassem determinado tamanho ao invés de basear as regras na plataforma que contém o conteúdo.

Queremos uma Splinternet?

Podemos estar a caminho de uma splinternet, a não ser que novas regras globais possam ser definidas. Elas precisam combinar os benefícios da transparência com o desejo de garantir que plataformas online operem de acordo com o interesse público.

No entanto, se plataformas forem forçadas a navegar por uma complexa rede de leis e regulamentos nacionais, arriscamos perder a interconectividade da comunicação online.

O fardo de encontrar uma solução não sobra somente para os governos e reguladores, mas para as próprias plataformas.

Sua legitimidade, aos olhos dos usuários, está ligada ao que o presidente do Banco da Inglaterra, Mark Carney, chamou para os mercados de uma “licença social para operar.”

Embora Google, Facebook, Apple, Amazon, Netflix e outros operem de forma global, precisam estar cientes de que o público espera que sejam uma força pelos bens sociais locais.

Texto original traduzido da publicação do BusinessInsider.


Considerações do tradutor:

Além do conceito de Splinternet, é interessante que nós brasileiros levemos em consideração as barreiras linguísticas encontradas na internet. Já comentei em algum lugar do blog sobre isso anteriormente, mas é evidente a distância do conteúdo e do discurso em inglês da internet – considerada pela maior parte dos usuários como o ponto de encontro global da web – do que podemos encontrar no português. Mesmo dentro da internet lusófona, há distância e desencontro do conteúdo visto em Angola, Portugal e Brasil.

Assim sendo, a Splinternet já existe de forma diferenciada para a maior parte dos internautas brasileiros. A não-proficiência no inglês já impede muitos de nós de acessar informações científicas e da mídia ao redor do mundo, prejudicando publicações acadêmicas, desenvolvimento de discurso político e conhecimento sobre os acontecimentos e desenrolar de eventos ao redor do mundo.

Porcentagens de páginas online por idioma. Fonte da imagem: Unbabel.com

Protagonistas como Google e Babelfish contribuem para a maior convergência de espaços separados na internet, o que é importante para a difusão da informação e o debate além-fronteiras. Mas os algoritmos e habilidades desses protagonistas ainda não são suficientes para realmente suprirem esse desencontro.

Por conta disso, convido os leitores que ainda não sabem inglês ou mesmo o espanhol a não terem medo de se aventurar por notícias nestes idiomas, usarem os tradutores e procurarem saber como publicações ao redor do planeta se referem a nós e ao mundo, para assim criarem uma opinião pessoal mais ampla e definida.