Olá, eu sou o António Lopes. Bem vindos a mais uma edição da newsletter Um sobre Zero.
Um apontamento de humor
Google e Inteligência Artificial
Custa acreditar que a Google, a empresa que desenvolveu a arquitetura de Transformers que é a tecnologia de Machine Learning que agora suporta os Large Language Models (LLMs) como o ChatGPT, não esteja a ser capaz de acompanhar esta corrida à Inteligência Artificial como um mercado de massas.
Desde o lançamento do ChatGPT, em que a OpenAI mostrou que estes LLMs podem ser usados para gerar chatbots que conversam ao nível de humanos, e desde o lançamento do BingChat, em que a Microsoft mostrou que aliar o ChatGPT ao Bing (o motor de pesquisa da Microsoft) pode tornar o mercado de pesquisa mais interessante e útil, que as equipas internas do Google estão a tremer como varas verdes.
Inicialmente, surgiu a indicação que Sundar Pichai, o CEO da Google, tinha lançado um “Code Red” (um sinal de alarme) internamente para que a prioridade da empresa fosse direcionada para tecnologias associadas a LLMs e outras ferramentas de Inteligência Artificial. Mais tarde, Pichai veio a negar que ele tinha lançado esse alarme e que, muito provavelmente, foi algo que surgiu entre a gestão intermédia da empresa. Mas acredito que ele deve ter sido convincente o suficiente para essa gestão intermédia ter ficado assustada ao ponto de ter lançado o “Code Red” por toda a empresa.
Seja como for, este sinal de alarme é bem claro: a Google percebeu que está a enfrentar uma ameaça existencial e tem de reagir. Mas será que vai conseguir reagir a tempo e bem? That’s the 100 billion dollars question, como se costuma dizer.
O Dilema do Inovador
Clayton Christensen escreveu um livro em 1997, com o título The Innovator’s Dilemma, que descreve o ciclo de inovações disruptivas que acontecem num mercado e que fazem com que surjam novos concorrentes que são capazes de destronar os gigantes estabelecidos nesses mercados. Uma das principais razões para este tipo de acontecimentos é o facto das empresas que estão bem estabelecidas num mercado terem frequentemente dificuldade em inovar porque estão concentradas em melhorar os seus produtos ou serviços existentes para satisfazer as necessidades dos seus clientes actuais. E como tal, por vezes, ignoram ou rejeitam novas tecnologias ou modelos de negócio que não se enquadram na sua estratégia actual ou que proporcionam margens mais baixas. Esta situação pode deixá-las vulneráveis ao surgimento de concorrentes mais pequenos e mais ágeis, que são capazes de criar novos mercados com soluções inovadoras.
Quando Christensen escreveu sobre esta temática entre 1995 e 1997, a Google ainda não existia, mas é fácil perceber como esta sua teoria se aplica ao momento que estamos a viver agora na Inteligência Artificial.
A Google desenvolveu (e apresentou ao mundo) a tecnologia de Machine Learning conhecida como os Transformers em 2017 e, no entanto, nos últimos 6 anos não foi capaz de realmente colocar no mercado um produto com base nessa tecnologia. Porquê? Porque o foco da empresa tem sido nos mercados que lhe dão dinheiro: pesquisa e anúncios. E é muito difícil para uma empresa bem estabelecida no mercado como a Google, e com um produto tão poderoso para a geração dos seus lucros (58% dos lucros da Google têm origem só nos anúncios), simplesmente focar-se numa área completamente nova e com a incerteza de conseguir chegar a um nível tão lucrativo como a pesquisa e os anúncios.
Não tenho dúvidas que, internamente, a Google tenha equipas a trabalhar nesta tecnologia desde 2017 e a gerar protótipos com muito potencial. Mas muito provavelmente, esses protótipos não foram “disruptivos” o suficiente para fazer acordar a gestão intermédia e de topo para os fazer perceber que estava na altura de “canibalizar” os seus produtos de sucesso para financiar a próxima vaga de inovação.
Isto abriu espaço para os concorrentes surgirem e a OpenAI e a Microsoft souberam aproveitar bem a oportunidade. E agora que a Google foi apanhada com “as calças na mão”, como é que vai reagir?
A reação à chapada metafórica
A Google levou de facto uma chapada e foi surpreendida pelo potencial do ChatGPT e de outros modelos de IA, principalmente quando viu que, pela primeira vez, surgiu uma verdadeira ameaça ao seu mercado da pesquisa. E, tal como referi acima, seja pela mão do CEO ou não, a Google emitiu internamente um alarme e o foco da empresa passou a ser, de um dia para o outro, em LLMs e IA.
Sundar Pichai, que é conhecido por dar uma ou duas entrevistas por ano, agora dá entrevistas a torto e a direito e anuncia precocemente tudo em que a Google está a trabalhar, só para garantir que se mantém relevante nesta conversa. Mas o que interessa perceber aqui é se a Google vai realmente ser capaz de lançar-se neste mercado e impor a sua posição dominante tal como tem feito no mercado da pesquisa.
Ao nível da pesquisa, ainda é capaz de ser cedo para termos números reais, mas tirando o impacto da novidade inicial em que o BingChat conseguiu tirar alguns (poucos) pontos percentuais ao Google, a fatia do mercado que o Google detém não mexeu assim tanto (pelo menos até agora). Mas isso não impediu Pichai de ter revelado que têm toda a intenção de adicionar inteligência artificial ao Google, seja para enriquecer os resultados das pesquisas, seja para adicionar uma vertente mais conversacional à forma como se fazem pesquisas. Esta é naturalmente a resposta ao BingChat, o mecanismo de pesquisa da Microsoft que usa o GPT-3.5 para transformar a pesquisa numa espécie de chatbot. Mas, se a Google não se despachar, esta resposta poderá ser tardia.
A visibilidade que esta inovação trouxe por exemplo ao Bing, está a fazer com que os fabricantes de dispositivos móveis considerem se não conseguem obter um acordo lucrativo com a Microsoft para colocarem o Bing como o motor de pesquisa por omissão nos dispositivos que vendem. Veja-se o exemplo da Samsung que, com inveja do acordo que a Apple fez com a Google há uns anos, está a considerar fazer o mesmo com a Microsoft. Ainda que a Samsung não possa fazer esse acordo no mercado dos EUA, o mercado Europeu e Asiático é outra conversa. Se isto acontecer, e se outros fabricantes forem pelo mesmo caminho, o impacto na fatia de mercado da pesquisa do Google pode ser maior do que o que estamos a ver agora.
No que toca ao LLM da Google, o Bard, que visa concorrer diretamente com o ChatGPT da OpenAI, Pichai quis tomar uma posição mais prudente e pediu aos seus funcionários que testassem o chatbot internamente antes deste ser disponibilizado publicamente, para evitar que este tivesse uma má recepção pública se desse respostas “alucinadas”. Infelizmente, parece que nem os próprios funcionários da Google gostam do Bard e chamam-no de “mentiroso compulsivo” e referem que é “pior que inútil”. Este é um golpe duro para as intenções da Google se manter à tona neste mercado.
Entretanto, a Google também anunciou que vai fundir as duas entidades internas de investigação em IA, a DeepMind e a Brain numa só entidade para unir esforços e optimizar os recursos nesta área. Mas toda a gente saber que as reorganizações, ainda que possam trazer bons resultados a longo prazo, no curto prazo causam confusão e instabilidade, que não é exatamente o que a Google precisa neste momento.
Portanto, o que é que isto tudo quer dizer para o futuro da Google nesta área de IA?
O futuro da Google na IA
Não há dúvida que a Google vai continuar a inovar em Inteligência Artificial, pelo menos ao nível da investigação que fazem. Mas têm de lançar os produtos rapidamente para o público ou perdem a única vantagem que têm em relação aos outros concorrentes: a quantidade absurda de utilizadores que usam os seus produtos atualmente.
O feedback dos utilizadores do ChatGPT é o que tem permitido tornar o produto cada vez melhor. E o ChatGPT “só” tem 100 milhões de utilizadores. O Google tem mais de 4 mil milhões de utilizadores. Se apenas uma parte desses utilizadores começarem a usar o Bard (quando este for lançado ao público) e derem feedback que permita melhorar continuamente o modelo, muito facilmente conseguirá sobrepor-se aos modelos da OpenAI. E não nos podemos esquecer que o Google indexa a internet (quase) toda. Tem acesso ao maior dataset de texto produzido por humanos do mundo.
Mesmo que o Bard não cumpra com as expetativas, a Google também tem alternativas. Como por exemplo, o investimento de $300M que fez na Anthropic, outra startup na área da IA generativa que foi fundada por ex-funcionários da OpenAI (num acordo semelhante ao que a Microsoft fez com a OpenAI).
A Pesquisa não é o único mercado (e na minha opinião, nem sequer é o mais indicado) em que podem cimentar a sua posição. A Google também já anunciou que pretende apostar fortemente na IA generativa ao nível da suite de aplicações do Google Workplace. O potencial para utilização deste tipo de tecnologia no Google Docs, Sheets e Slides é enorme, mas mais uma vez, têm de ser rápidos ou arriscam-se a ser eclipsados pela Microsoft com a adição das mesmas funcionalidades ao nível do Office365.
A vantagem que a Google tem também no YouTube é enorme. Para além de ser o maior repositório de vídeo digital do planeta (e um dos motores de pesquisa mais utilizados no mundo), provavelmente tem transcrições de uma boa parte desses vídeos, o que faz com que tenha também acesso ao maior dataset de treino para modelos de geração de vídeo e áudio.
Mas nada disto representará uma real vantagem para a Google se não souber transformar isto em produtos que as pessoas queiram usar.
A concorrência nos outros gigantes da tecnologia não parece ser o problema. A Meta também anda a apanhar papéis nesta área, sem conseguir apresentar produtos que possam realmente fazer frente à OpenAI (apesar do Zuckerberg estar com a ideia certa de que aposta deve ser nos agentes autónomos). Do lado da Apple, já perceberam que aquela que deveria ser a iniciativa que os distinguia na área da IA, a Siri, também está a ficar para trás e nem os próprios funcionários da Apple acham que a assistente virtual tem futuro. Mas ao menos perceberam que devem capitalizar o facto de terem acesso a um dos maiores datasets mundiais de informação de saúde (graças ao Apple Watch) e apostar fortemente na IA na área da saúde.
Portanto, só resta mesmo à Google perceber que tem de deixar de estar agarrada ao status quo da pesquisa tradicional e procurar investir nos produtos de IA que vão substituir a sua galinha dos ovos de ouro. Porque senão, arrisca-se a cair no esquecimento.
Vejamos o que os próximos episódios nos trarão.
Notícias Várias
A empresa Palantir, conhecida por desenvolver tecnologia de análise de dados e vigilância baseada em Inteligência Artificial, anunciou um novo produto que integra modelos de linguagem para ajudar na tomada de decisões em cenário de guerra (Skynet, portanto). Eles referem que o sistema tem protecções para evitar acções não autorizadas, mas não é claro que medidas são tomadas para evitar que o sistema se baseie em dados imprecisos ou "alucine" detalhes (tendo em conta que os LLMs não têm a capacidade de responder que simplesmente não sabem uma resposta). Tudo isto parece-me uma péssima ideia. Felizmente, legisladores dos EUA já estão a trabalhar para garantir que é proibido automatizar os sistemas de lançamento de armas nucleares, para evitar que a malta comece a ter ideias de usar o ChatGPT para ajudar a decidir se está na altura de bombardear um qualquer país.
75% dos fornecedores da grande cadeia de hipermercados Walmart nos EUA, após passarem uns tempos a usar o novo sistema de negociação da Walmart baseado em chatbots inteligentes, manifestaram a sua preferência de continuar a usar este sistema em vez de interagirem com humanos. Mais uma área em que a IA ameaça os humanos.
O pessoal que está a usar estes novos modelos de linguagem para gerar SPAM, desinformação e reviews falsas de produtos em sites como a Amazon, é tão preguiçoso que nem sequer se dão ao trabalho de verificar os textos que são gerados. Isto tem a consequência curiosa de poluir a internet com textos que começam com “As an AI language model” (porque este é o prefixo que modelos como o ChatGPT colocam nos textos gerados para de certa forma justificarem a limitação de algumas das suas respostas).
O ChatGPT está de volta à Itália, e em parte isto é devido ao facto da OpenAI ter introduzido novas opções no seu chatbot para permitir que os utilizadores possam escolher não guardar o histórico das conversas e que as mesmas não possam ser usadas para o treino de futuros modelos. E o Sam Altman respira de alívio.
O maior fabricante de baterias, CATL, anunciou um avanço muito interessante na densidade das baterias: 500 Wh/kg. Para terem uma ideia, a densidade da bateria do meu carro (um Nissan Leaf) é de cerca de 132 Wh/kg. O que significa que se tivesse uma bateria com a mesma dimensão mas desta nova geração, o carro teria quase 4 vezes mais autonomia. Estas novas baterias provavelmente só começarão a ser produzidas no final deste ano e a entrar no mercado no início do próximo ano, mas este é o tipo de avanço que poderá fazer uma grande diferença na adopção de veículos elétricos.
Se o Reino Unido insistir com a implementação da Online Safety Bill, que entre outras coisas obriga os sites a fazerem uma verificação de idade dos seus visitantes, é possível que os cidadãos deste país percam o acesso à Wikipedia. Como se já não bastassem os banners de cookies…
Na edição anterior da newsletter, eu falava sobre a possibilidade da Apple ter de permitir a instalação de aplicações nos iPhones vindas de outras lojas que não a App Store. Contudo, um tribunal dos EUA, que analisou um recurso da Apple, refere agora que o facto da Apple impor a instalação de aplicações por via da App Store (por questões de segurança) não viola as leis de anti-concorrência. No entanto, a Apple terá de deixar que os criadores das aplicações possam informar os seus clientes de formas alternativas de pagamento pelas aplicações e respetivos serviços sem ser pela via da App Store (que obriga a uma fatia de 30% que vai para a Apple).
Agora também o G7 mostrou estar sensibilizado para a necessidade de regular a Inteligência Artificial e definiu cinco princípios fundamentais para regular a utilização de IA: estado de direito, garantias jurídicas, democracia, respeito pelos direitos humanos e aproveitamento de oportunidades para promover a inovação.
Artigos Científicos Interessantes
arxiv - Inducing anxiety in large language models increases exploration and bias
Os autores deste artigo descobriram que, se usarem técnicas bem conhecidas da psiquiatria para induzir ansiedade em humanos, mas aplicada a modelos de linguagem como o ChatGPT, estes modelos reagem como os humanos mas num grau de magnitude superior (mostrando maior enviesamento e racismo em certas tarefas). Isto mostra o quão bem estes modelos conseguem reproduzir (e amplificar) comportamento humano e como podem ser usados para estudar a psique humana, ao mesmo tempo que define uma base muito importante sobre como se deve comunicar com estes modelos para obter os melhores resultados.
arxiv - LLM+P: Empowering Large Language Models with Optimal Planning Proficiency
Na edição passada da newsletter, eu falei sobre a investigação que tenho feito ao longo das últimas duas décadas. Muita dessa investigação, principalmente no doutoramento, envolvia lidar com motores de planeamento, que davam a capacidade aos agentes inteligentes autónomos de gerarem planos para executar tarefas que lhes fossem apresentadas. Este artigo explora o que acontece quando se junta um motor de planeamento a um LLM. Spoilers: o LLM torna-se muito mais útil porque passa a ter a capacidade de efetivamente planear tarefas complexas, ao invés de simular que está a planear uma tarefa quando na verdade está só a gerar texto.
Recomendações de leituras
The Cognitive Revolution - Can GPT-4 Do Science?
Este artigo é claro: não, o GPT-4 não está ao nível de um cientista humano, de conseguir definir hipóteses por si próprio e levar a cabo o método científico. Mas há uma coisa em que é muito bom, é ser assistente de investigação. As tarefas rotineiras de análise de dados e sumarização de informação é algo que esta versão do chatbot da OpenAI é de facto muito boa e pode ser usada para acelerar a produção de investigação e ciência.
Recomendações de podcasts
Prima Qualquer Tecla - Episódio 150 - 3º aniversário
Tive o prazer de ser convidado, juntamente com mais ilustre malta (António Machado, Basílio Vieira, Cláudia Mendes Silva), no podcast Prima Qualquer Tecla. É bom ter assim momentos de pura descontração e muita galhofa (muito por causa do António Machado). Obrigado ao Armando Alves, Paulo Laureano, Pedro Aniceto e Vitor Domingos pelo convite.
Recomendações de links
Nota final
Eu sou utilizador assíduo da app Timehop (uma app que permite revisitar conteúdos que produzimos como fotos, vídeos, tweets e outros conteúdos na data de hoje, mas em cada um dos anos para trás) há mais de meia década. É um exercício diário delicioso e nostálgico.
Infelizmente, a decisão de cortar o acesso gratuito à API do Twitter fez com que esta app passasse a ser bastante menos interessante para mim. Mais uma consequência desta gestão desastrosa do Elon Musk (e mais um prego no caixão) do Twitter.
Até à próxima!
António Lopes