20 Mai 2026 5 min de leitura News

IA científica avança, mas esbarra nos limites da linguagem natural

Dois novos sistemas de IA para descoberta científica, Robin e Co-Scientist, demonstram avanços na geração de hipóteses para reposicionamento de fármacos, mas revelam que a linguagem por si só é insuficiente para modelar a complexidade da natureza. O futuro exige integração com dados quantitativos e experimentação física.

O que aconteceu

Dois artigos publicados na Nature descrevem sistemas de IA projetados para acelerar o reposicionamento de fármacos – encontrar novos usos para medicamentos já existentes. O sistema Robin, da Future House, e o Co-Scientist, do Google DeepMind, utilizam múltiplos agentes baseados em modelos de linguagem (LLMs) para gerar hipóteses, revisar literatura e sugerir experimentos.

No Co-Scientist, agentes especializados simulam tarefas cognitivas como reflexão crítica e ranqueamento de ideias usando torneios com sistema de pontuação Elo. Já o Robin possui agentes voltados para tarefas específicas, como seleção de testes experimentais e análise de dados biomédicos. Ambos foram testados em cenários reais: o Co-Scientist propôs 30 candidatos a fármacos para leucemia mieloide aguda; o Robin fez o mesmo para degeneração macular relacionada à idade.

Interface futurística de um sistema multiagente de IA para descoberta científica, com painéis de dados e nós de linguagem em ambiente de laboratório isométrico — Arquitetura multiagente promete automatizar partes do método científico, mas esbarra nos limites da linguagem.

O que há de novo

A novidade real reside na arquitetura multiagente e na tentativa de operar diretamente no domínio da linguagem científica, em vez de apenas processar dados brutos. Os sistemas permitem que cientistas humanos interajam com a IA por meio de discussões em linguagem natural, algo que promete colaborações mais fluidas.

No entanto, a inovação tem limites claros. Ambos os sistemas dependem fortemente de aporte humano para definir questões científicas, filtrar resultados e priorizar experimentos. O Robin, por exemplo, teve várias sugestões de experimentos rejeitadas pelos cientistas humanos. Além disso, nenhum dos sistemas foi comparado com métodos computacionais especializados desenvolvidos ao longo de décadas na biologia computacional – como as plataformas CMAP, LINCS ou modelos de deep learning específicos para reposicionamento de fármacos. Isso significa que não se sabe se essas novas ferramentas gerais realmente superam abordagens anteriores.

Por que isso importa

A relevância desse avanço vai além dos resultados laboratoriais. Ele revela o teto atual dos assistentes científicos baseados em LLMs: são excelentes em navegar pela literatura e sugerir conexões textuais, mas falham em capturar a complexidade não verbal dos sistemas biológicos. O mundo natural não se resume a palavras; ele é governado por interações moleculares, dinâmicas celulares e processos fisiológicos que a linguagem só descreve de forma aproximada.

Isso tem implicações diretas para o setor farmacêutico, que investe bilhões em pesquisa e desenvolvimento. Um sistema que acelere a identificação de candidatos promissores pode reduzir custos e tempo, mas se a confiança nos resultados for baixa ou se a IA gerar hipóteses que não se sustentam em validação experimental, o ganho real pode ser ilusório. A adoção por parte da indústria dependerá de evidências sólidas de que esses sistemas agregam valor além das ferramentas já existentes.

A leitura técnica

Do ponto de vista técnico, os sistemas trazem inovações dignas de análise:

Coordenação multiagente: Tanto Robin quanto Co-Scientist organizam agentes especializados que colaboram sob supervisão de um agente coordenador. Essa abordagem permite decompor tarefas complexas (revisão de literatura, geração de hipóteses, análise de dados) em subtarefas gerenciáveis.
Autoavaliação via Elo: O Co-Scientist utiliza um sistema de rating Elo para classificar suas próprias hipóteses em torneios, alinhando-se bem ao julgamento de especialistas humanos. Isso é um passo importante para aumentar a confiabilidade das saídas.
Dependência de prompts: O Robin mostrou que agentes focados em análise estatística e bioinformática tiveram desempenho inferior, precisando de prompts humanos detalhados. Isso revela a fragilidade dos LLMs em tarefas que exigem precisão quantitativa.
Ausência de validação experimental: Ambos os sistemas param antes da validação física, transferindo o ônus da experimentação para os cientistas humanos. Em um processo de descoberta, a geração de hipóteses é apenas o primeiro passo – a confirmação exige dados reais.

A leitura de mercado

O movimento do DeepMind e da Future House sinaliza uma corrida pelo mercado de IA para descoberta científica. O reposicionamento de fármacos é um alvo de alto valor: estima-se que cada novo medicamento custe bilhões de dólares e leve mais de uma década para chegar ao mercado. Qualquer tecnologia que reduza esse tempo ou custo tem potencial de mercado expressivo.

Contudo, o cenário competitivo inclui décadas de métodos computacionais especializados. Ferramentas como CMAP (Connectivity Map) e LINCS (Library of Integrated Network-Based Cellular Signatures) já integram dados transcriptômicos e químicos para sugerir reposicionamentos. Os novos sistemas baseados em LLMs precisarão demonstrar vantagem concreta – não apenas em termos de hipóteses geradas, mas em taxa de sucesso experimental e custo-efetividade.

Além disso, a confiança é um fator crítico. Empresas farmacêuticas e de biotecnologia devem exigir validação rigorosa antes de adotar essas ferramentas como parte do pipeline de P&D. O hype em torno da IA pode criar expectativas irreais, e um desempenho aquém do esperado pode atrasar a adoção.

Riscos, limites e pontos de atenção

É importante considerar os pontos cegos desses desenvolvimentos:

Conflito de interesses: O artigo original de análise foi escrito por uma autora que declarou possuir ações do Google (controladora do DeepMind) e ocupar cargos em conselhos de organizações de saúde e IA. Isso não invalida a análise, mas merece ser levado em conta ao interpretar as críticas.
Resultados preliminares: Os experimentos foram em pequena escala (cinco drogas testadas no caso do Co-Scientist, duas promissoras no Robin). Não houve replicação independente, e a taxa de sucesso real ainda é desconhecida.
Falta de comparação: A ausência de benchmarks contra métodos especializados torna impossível afirmar se esses sistemas representam um avanço genuíno ou apenas uma nova forma de gerar hipóteses já conhecidas.
Qualidade da ciência gerada: A autora levanta preocupações mais amplas sobre o aumento de artigos gerados por IA com referências fabricadas e imagens enganosas. Sistemas que produzem hipóteses sem validação podem agravar esse problema se não houver mecanismos de controle.
Limitação fundamental: Como bem apontado, a linguagem é inerentemente imprecisa e ambígua. A ciência exige especificidade, e modelos que operam apenas no espaço das palavras não podem capturar as relações quantitativas exatas necessárias para modelar sistemas biológicos complexos.

O que isso sinaliza daqui para frente

Robin e Co-Scientist não são o ponto de chegada, mas um indicador do caminho. A próxima fronteira será a integração entre linguagem e dados quantitativos estruturados. Modelos que combinam raciocínio textual com representações de sequências genômicas, estruturas proteicas e imagens celulares – como os modelos multimodais que começam a surgir – têm potencial para superar as limitações atuais.

A mensagem central é clara: a IA pode ser uma copiloto poderosa na ciência, mas não substituirá a experimentação e a interpretação humana tão cedo. O valor real estará em sistemas que saibam conectar palavras a números, hipóteses a evidências e teoria a prática. Enquanto isso, a comunidade científica precisa manter um olhar crítico – celebrando o progresso, mas sem ignorar os limites da linguagem.

O futuro da descoberta científica assistida por IA não será escrito apenas com palavras, mas com dados, experimentos e, acima de tudo, com rigor.

Resumo prático:

Sistemas multiagente como Robin e Co-Scientist avançam na geração de hipóteses em linguagem natural, mas ainda são limitados pela falta de dados quantitativos e validação experimental. Para a indústria farmacêutica, a adoção exige evidências de vantagem sobre métodos consolidados. O caminho promissor está na integração multimodal entre texto, dados biomoleculares e experimentação física.

Na Metatron Omni, acompanhamos de perto essas fronteiras entre inteligência artificial e rigor científico. O próximo passo não é apenas mais linguagem – é conectar o que as palavras dizem ao que os números revelam.