Olá, eu sou o António Lopes. Bem vindos a mais uma edição da newsletter Um sobre Zero.
Estive muito tempo fora, mas este arranque de ano letivo foi especialmente ativo para o meu lado e deixou-me sem tempo para absolutamente nada. A ver se agora consigo aos poucos voltar à escrita da newsletter. E arranco agora com uma revisão do que se passou nos últimos meses na área da ciência e tecnologia.
Um apontamento de humor
Ahh a nostalgia das velhas disquetes. O facto da secção de metal deslizar para permitir guardar coisas é a cereja no topo do bolo.
Resumo de notícias
A newsletter esteve parada nos últimos 3 meses e portanto, desta vez achei que era melhor falar sobre algumas das principais temáticas da ciência e tecnologia que ocuparam a sociedade nesses tempos.
Não, o LK-99 não é um supercondutor
Se bem se lembram, na última edição da newsletter, eu estava bastante entusiasmado (mas cauteloso) com a possibilidade de finalmente se ter descoberto um material supercondutor: o LK-99. Infelizmente, vários investigadores à volta do mundo tentaram replicar a experiência e acabaram por determinar que o composto LK-99 não é um supercondutor, dissipando as esperanças da descoberta do século da existência de um supercondutor à temperatura ambiente.
Eles descobriram que as impurezas no material, especialmente o sulfureto de cobre, eram responsáveis pelas suas aparentes propriedades supercondutoras. Embora uma equipa sul-coreana tenha afirmado que o LK-99 apresentava supercondutividade, estudos separados realizados em Pequim e por investigadores americanos e europeus sugerem que se trata, na realidade, de um isolador.
É pena, mas ao menos veio algo de bom nesta saga científica. A rapidez da resolução e do minucioso trabalho de detetive envolvido fez com que não se perdesse demasiado tempo com o assunto.
A greve dos argumentistas e atores em Hollywood chegou ao fim
Eu referi na última edição da newsletter que esta luta dos argumentistas e atores ia ser complicada. E realmente, a “luta” durou alguns meses até chegar agora a este acordo entre as partes. Vamos lá a um pequeno resumo. O que é que os argumentistas/atores conseguiram?
Conseguiram que houvesse um aumento considerável nos salários e que fossem criadas proteções contra o uso de Inteligência Artificial para substituir argumentistas/atores no seu trabalho e também para o uso do seu trabalho para treino de futuros modelos (sem qualquer tipo de compensação). Esta é uma vitória considerável tendo em conta a posição frágil que estes argumentistas/atores se encontravam na negociação com os estúdios (e mesmo agora quando tentam lutar contra isso).
Conseguiram também que os estúdios sejam obrigados a divulgar métricas de popularidade de filmes e séries em streaming aos sindicatos. Isto permite que os argumentistas/atores fiquem numa posição mais vantajosa para negociar futuros contratos.
Contudo, apesar da divulgação destas métricas poder ajudar no poder negocial, a verdade é que não conseguiram efetivamente vincular que as compensações que os argumentistas/autores recebem sejam diretamente ajustadas por esses métricas de popularidade. O que significa que mesmo que sejam autores ou atores numa série que acabe por se tornar popular mais tarde, não irão receber mais por isso.
E estas pequenas vitórias, apesar de parecerem importantes, não estão asseguradas por muito tempo. O acordo a que as partes chegaram, só tem a duração de 3 anos. O que significa que daqui a 3 anos, se os estúdios sentirem que a utilização de IA para produzir filmes/séries estiver mais avançada e que permita de certa forma abdicar de alguns argumentistas e atores, a nova “batalha” entre estas partes não vai ter um resultado tão simpático para os argumentistas/atores.
A evolução multi-modal do ChatGPT
O ChatGPT Plus, que é alimentado pelo modelo de linguagem GPT-4 da OpenAI, tem agora novas capacidades de reconhecimento de imagem e de voz e também de pesquisa na internet. Os utilizadores podem por exemplo carregar fotografias e fazer perguntas sobre elas ou gerar imagens com base em comandos. Podem também interagir com o ChatGPT com comandos de voz e ouvir as respostas em tempo real com uma voz sintética. E podem também obter resultados de pesquisa relevantes em tempo real, uma vez que o ChatGPT está agora também ligado ao motor de pesquisa Bing da Microsoft.
Esta evolução culmina no desenvolvimento de um verdadeiro assistente virtual capaz de interagir com humanos de formas muito diferentes e versáteis. O potencial para o aumento da produtividade é enorme. No entanto, a OpenAI está ciente dos riscos envolvidos no lançamento deste tipo de funcionalidades e é cautelosa quanto a potenciais utilizações indevidas.
A equipa da OpenAI refere que passou meses a pensar e a implementar salvaguardas para evitar utilizações indevidas, mas todos sabemos que não vai demorar muito até que haja alguém a descobrir formas de ultrapassar essas barreiras e mostrar como é possível produzir conteúdos ofensivos, preconceituosos ou maliciosos.
A Inteligência Artificial num dispositivo móvel
Começa a ver-se um grande esforço em tentar desenvolver a ideia de encapsular a IA num dispositivo móvel para o seu uso no dia-a-dia. E é engraçado ver as diferentes perspetivas e iniciativas que vão surgindo.
A empresa Humane, criada por dois ex-funcionários da Apple, tem apostado num pequeno aparelho que está sempre ao peito (com aspirações de moda) e que funciona como um assistente de AI capaz de interagir com o seu utilizador por voz mas também fazendo pequenas projeções de conteúdo gráfico na palma da mão, como evidenciado numa TED Talk feita recentemente. Eu gosto desta ideia de abstrair a computação a outro tipo de interfaces, mas acho que estamos ainda muito no início.
Uma outra iniciativa é o Rewind Pendant, um dispositivo em forma de colar que capta e transcreve as interacções no mundo real, ajudando a criar uma IA personalizada com base nas próprias experiências da pessoa. Isto é uma versão muito mais básica daquilo que se viu no episódio do Black Mirror, “The Entire History of You” em que a sociedade vive com dispositivos implantados que permitem gravar e rever todas as suas interações do dia-a-dia. É um pouco assustador este futuro, mas ainda estamos muito longe disso. Não sei é como é que esta empresa pensa lidar com o problema de privacidade e segurança que este tipo de dispositivo vai introduzir.
E finalmente, o mundo foi surpreendido pelo anúncio de uma parceria entre Jony Ive (o ex-chefe de design da Apple) e a OpenAI para criarem um dispositivo misterioso que irá fazer uso das tecnologias de IA da OpenAI. Será um smartphone? Serão uns óculos? Será um anel ou um colar? Ninguém sabe.
Os Beatles têm uma nova música
Os Beatles já não lançavam músicas novas desde 1995. Agora lançaram a música intitulada "Now and Then", onde Paul McCartney e Ringo Starr utilizaram uma antiga gravação lo-fi de John Lennon para produzir uma música nova usando “pózinhos mágicos” de IA.
A produção desta música já tinha sido iniciada e depois interrompida em meados dos anos 90 devido a problemas técnicos, mas foi finalmente concluída após quase um quarto de século. O lançamento coincide com o documentário Get Back do realizador Peter Jackson, onde já tinham sido usadas técnicas de machine learning para separar diferentes componentes das músicas dos Beatles e criar registos separados com qualidade. Paul McCartney e Ringo Starr usaram depois as mesmas técnicas para completar esta canção inacabada dos Beatles chamada "Now and Then".
Este projeto abre novas possibilidades de restaurar e revitalizar gravações antigas de outros artistas no futuro. Já a discussão sobre a ética de produzir conteúdos de artistas já mortos recorrendo a IA (como o exemplo que dei da Elis Regina na última edição da newsletter) fica para outra altura.
Spotify usa IA para expandir o mercado de podcasts
O Spotify introduziu uma nova funcionalidade de tradução de voz baseada em IA que permite aos podcasters falar instantaneamente em diferentes línguas utilizando as suas próprias vozes. Mas esta nova funcionalidade ainda não está disponível para todos. Inicialmente, a empresa estabeleceu uma parceria apenas com alguns podcasters mais populares para traduzir os seus episódios em inglês para espanhol e planeia adicionar em breve traduções para francês e alemão. A ferramenta, alimentada pela tecnologia de transcrição de voz da OpenAI, não só traduz o discurso como também o reproduz numa versão sintetizada da voz do podcaster.
O objetivo do Spotify é, segundo eles, proporcionar aos ouvintes de todo o mundo poderem ouvir os podcasts que gostam na sua própria língua. Mas, naturalmente, o que o Spotify está à procura é aumentar largamente a sua audiência no que toca aos podcasts. E o potencial é enorme. Basta pensar na América Latina e na quantidade de gente nestes países que até gostaria de ouvir podcasts de certas pessoas (como o Joe Rogan) mas para quem a barreira linguística existe, por causa do meio auditivo não permitir a legendagem como o vídeo permite.
Agora, não podemos descurar o perigo que está na criação deste tipo de tecnologia. A OpenAI também anunciou uma ferramenta capaz de criar áudio semelhante ao de uma pessoa a partir de texto e de alguns segundos de amostra de discurso dessa pessoa. E ferramentas deste tipo podem ser usadas para produzir clipes de áudio para desinformação e fraude se estiverem livremente disponíveis.
6 meses de pausa na IA… onde eles já vão?
Já passaram mais de 6 meses desde que surgiu a tal carta de algumas personalidades a pedir uma pausa de 6 meses no desenvolvimento de modelos de IA. E, como é sabido, nada mudou. As empresas de IA continuam a apostar forte na evolução dos seus modelos e os investimentos nestas empresas continuam a aumentar, como é evidente nos apoios da Amazon e Google à Anthropic. Elon Musk, um dos signatários da carta, durante este período decidiu criar uma empresa de IA para concorrer com a OpenAI na criação de modelos de linguagem altamente avançados.
Apesar da carta não ter produzido efeitos no objetivo principal, esta teve um efeito interessante, que foi reforçar a necessidade de debate sobre o impacto da IA na sociedade. E, no seguimento disso, a OpenAI anunciou a criação de uma equipa interna só para o estudo de catástrofe introduzida por IA e o governo dos EUA também criou o AI Safety Institutecom o objetivo de tentar assegurar que o desenvolvimento destas tecnologias de IA não vão por caminhos que possam ser destruidores da sociedade.
Eu continuo a achar que o foco do debate devia estar nas ameaças imediatas da IA e não nos cenários apocalípticos inspirados em filmes de ficção científica, até porque assim, a geração de medo à volta destes cenários hipotéticos, contribui mais para criar um ambiente de anti-concorrência em que os pequenos concorrentes não chegam sequer a ter a possibilidade de chegar aos calcanhares das grandes empresas.
Techno-optimist manifesto
Marc Andreessen, conhecido pioneiro da Internet e venture capitalist, deve ter tomado uns cogumelos mágicos e decidiu escrever um manifesto sobre a necessidade de sermos ainda mais optimistas na aposta que fazemos na tecnologia e ignorar aqueles que só querem impedir que a sociedade avance (quase em contraponto direto à carta referida acima). Esta foi a mensagem geral dele e dá perfeitamente bem para ver que só pode ser baseada na perspetiva de alguém que só é relevante na sociedade enquanto houver investimento no constante uso e desenvolvimento de novas tecnologias.
No geral, eu até concordo com o sentimento de que a tecnologia tem vindo a servir a sociedade e a permitir uma evolução para melhor. Mas o teor com que ele transmite esta ideia e como considera que o único dogma possível é o típico emblema de Silicon Valley do “move fast and break things” é o de alguém que não tem (ou prefere ignorar a) noção do impacto que certas tecnologias têm tido na sociedade. Há muitas invenções tecnológicas que não tiveram um saldo positivo na sociedade. E é possível que nem sempre isso seja culpa da inovação em si, mas sim da forma como os humanos a usaram. Em todo o caso, isto é razão suficiente para sermos vigilantes e avaliarmos constantemente o impacto que cada nova tecnologia tem na sociedade.
E, como tal, discordo em absoluto com a parte em que o Marc Andreessen afirma que se tem de remover as barreiras para a inovação tecnológica e de que há inimigos do avanço tecnológico que são inúteis. Esses aparentes opositores (que na verdade são explorações filosóficas de ética, segurança, privacidade, etc.) são muito importantes, porque ajudam a definir se o caminho que as inovações tecnológicas tomam está de facto alinhado com o que a sociedade quer ou precisa (e não só o que techies que estão à frente das empresas decidem/querem).
Regulamentação de Inteligência Artificial
No lado oposto da sociedade ao Marc Andreessen, temos as instituições governamentais de todo o mundo a analisarem esta temática da IA e como a podem regulamentar para travar o seu avanço desenfreado. Contudo, a UE parece estar com dificuldades em avançar com legislação sobre IA. A lei de IA da UE, que visa regulamentar a inteligência artificial, ainda está a ser debatida pelos legisladores europeus (há mais de um ano). Os constantes desacordos entre os vários países provocaram atrasos e é pouco provável que o projeto seja aprovado antes de dezembro deste ano. A expetativa sobre esta legislação é bastante elevada, uma vez que, tal como aconteceu no passado com o RGPD, muitos vêem o AI Act da UE como um modelo potencial para a regulamentação global da IA generativa. Mas isso só acontece se conseguirem avançar mais rapidamente.
Entretanto, os EUA estão a tentar avançar com a sua própria regulamentação de IA. O Presidente Joe Biden emitiu uma ordem executiva que obriga as empresas de IA a:
Realizar os chamados testes de “red-team” aos seus modelos e partilhar esses resultados com o Governo dos EUA;
Proteger contra o uso de IA para desenvolver materiais biológicos perigosos;
Criar standards e definir boas práticas para a deteção de material gerado por IA e para garantir que sistemas de IA sejam seguros e confiáveis;
Desenvolver ferramentas de IA para procurar e corrigir falhas em software crítico.
Há outros pontos mas, no geral, estes são os mais impactantes.
E como já referi acima, a Vice-Presidente dos EUA anunciou também a criação de uma série de iniciativas para efetivamente garantir o desenvolvimento seguro e confiável de sistemas de IA, sendo uma das principais iniciativas a criação do AI Safety Institute.
A China também tem mostrado alguma vontade em regulamentar a IA e desde abril que anda a tomar algumas medidas. Até a Organização Mundial de Saúde emitiu a sua opinião sobre quais devem ser as diretrizes de regulamentação da utilização da IA na saúde.
E lá naquela ilha separada da UE continua a narrativa da IA do Exterminador Implacável e, portanto, decidem fazer uma cimeira para discutir apenas os cenários catastróficos, em vez de se concentrarem nos problemas atuais e avançarem com regulamentação adequada.
A Amazon e os seus truques
Aparentemente, a Amazon foi apanhada numa artimanha em que utilizou um algoritmo secreto, denominado "Projeto Nessie", para determinar até que ponto poderia aumentar os preços antes de os concorrentes deixarem de seguir o exemplo. O algoritmo aumentava os preços e verificava se outros retalhistas, como a Target, faziam o mesmo. Se os concorrentes não aumentassem os preços, a Amazon voltava ao normal. Ou seja, a Amazon conseguiu automatizar um cartel de preços (sem que os concorrentes realmente soubessem).
Esta informação foi revelada numa queixa apresentada pela Comissão Federal do Comércio (FTC) dos EUA, que acusou a Amazon de violar as leis anti-concorrência. A FTC pediu à Amazon que revele o âmbito completo das suas alegadas práticas ilegais. É claro que a Amazon nega estas alegações e tenciona defender o seu caso em tribunal, mas ao que parece, há evidências que não são nada simpáticas para a Amazon. Vamos a ver como isto se desenrola nos tribunais.
Recomendações de leituras
Public Experiments - Why Open Source AI Will Win
Esta é uma edição de uma newsletter muito interessante que fala sobre o potencial futuro dos modelos open-source de IA e como estes podem fazer frente aos modelos de linguagem gerados pelas grandes empresas tecnológicas. Gosto principalmente do facto de se abordar a questão de que toda a gente acha que precisa de um modelo super-inteligente e gigante que consegue processar todo o tipo de pedidos, quando na verdade, o que acabamos por precisar é cada vez mais de pequenos modelos altamente especializados em tarefas mais específicas e adaptadas aos nossos use-cases do dia-a-dia. E é aí que os modelos open-source podem facilmente fazer frente aos modelos gigantescos.
Noema - The Illusion Of AI’s Existential Risk
Um artigo que aborda um ponto que já tenho referido algumas vezes (e que reforço sempre em conversas com amigos), sobre a necessidade de não nos focarmos tanto nos potenciais riscos futuros e existenciais da aplicação da IA na sociedade, mas sim nos riscos que são imediatos e mais importantes de combater agora, como o impacto na força laboral da sociedade e na utilização de IA para desinformação e fraude generalizada.
Wired - Hyperdimensional Computing Reimagines Artificial Intelligence
Este artigo deixou-me com água na boca, pois representa uma nova forma de potencialmente desenvolver modelos que consigam representar de forma mais adequada o significado semântico que nós atribuímos às coisas e como desenvolvemos conhecimento abstracto. Tenho de ler mais sobre isto e mais a fundo para perceber se isto é mesmo assim como estão a tentar “vender”.
Brian Christian - The Alignment Problem
Um dos melhores livros que li recentemente sobre o impacto da IA na sociedade. Extremamente bem escrito e, apesar de ter sido publicado em 2020, consegue manter-se atual numa altura em que estas tecnologias avançam tão rapidamente que tornam-se também rapidamente obsoletas.
Recomendações de artigos científicos
Arxiv: A Practical Deep Learning-Based Acoustic Side Channel Attack on Keyboards
Com a pandemia, veio a normalização das video-conferências. O que pode não ser logo evidente para quem passa o dia em reuniões do género, é que o microfone que tão simpaticamente transmite a nossa voz para a video-conferência e que permite manter uma comunicação fluída com uma pessoa do outro lado do mundo está na verdade sempre à escuta. E é esse estado de constante captação de som que pode ser usado para fins nefastos. O que este artigo mostra é que é possível treinar um modelo para traduzir o som do bater das teclas no teclado enquanto escrevemos através do som que é recebido numa chamada zoom, com uma precisão de 93%. Quer isto dizer, que a pessoa do outro lado da chamada zoom, se correr este modelo pode por exemplo obter uma password que eu esteja a inserir no teclado durante essa video-chamada (vá, com 93% de precisão). Assustador.
A deteção de objetos em imagens é uma área que tem evoluído imenso na última década com a introdução de deep neural networks. Mas mesmo essas abordagens têm mostrado dificuldades em classificar certas imagens que enquadram os objetos de forma mais isolada. Este artigo mostra que ajustar o zoom em blocos da imagem é o suficiente para melhorar grandemente a classificação de objetos em imagens mais desafiantes. Uma solução tão simples (que não exige alteração da rede neuronal treinada) e com resultados tão interessantes.
Nota final
Mas agora temos tempestades (com nomes) todas as semanas? A minha mini-horta em casa não aguenta este ritmo de chuva e vento.
Ainda é muito cedo para ter saudades de me queixar do calor?
Até à próxima!
António Lopes
Já sentia saudades desta Newsletter. Excelente escrita, informativa e cativante como sempre. Obrigado!