Ia prediz mutações de doenças raras com análise da “árvore da vida”

Compartilhe

Um novo modelo de inteligência artificial, denominado popEVE, apresenta uma abordagem inovadora na identificação de mutações proteicas humanas com alta probabilidade de causar doenças, incluindo aquelas nunca antes observadas. Desenvolvido por cientistas da Harvard Medical School e do Centro de Regulação Genômica (CRG) em Barcelona, o sistema promete revolucionar o diagnóstico de doenças genéticas.

Segundo a Dra. Mafalda Dias, pesquisadora do CRG e coautora do estudo, o popEVE surge como ferramenta crucial para auxiliar médicos na identificação de mutações causadoras de doenças, especialmente em contextos onde o acesso ao DNA dos pais é limitado. A ferramenta já demonstra sua utilidade em colaborações com diversas clínicas.

O modelo utiliza dados de centenas de milhares de espécies e da variação genética da população humana. Essa base de dados evolutiva permite que o sistema identifique quais partes das aproximadamente 20.000 proteínas humanas são vitais e quais podem tolerar mudanças. Assim, o popEVE não só identifica as mutações, mas também avalia a sua gravidade.

Uma vantagem significativa do modelo é sua capacidade de operar apenas com informações genéticas do paciente, o que torna o diagnóstico de doenças raras mais rápido, simples e acessível, inclusive em sistemas de saúde com recursos limitados.

Publicidade

O genoma de cada indivíduo possui variações que o tornam único, incluindo mutações de sentido trocado que alteram um único aminoácido em uma proteína. Determinar quais dessas mutações são inofensivas e quais causam doenças graves é um desafio. Adicionalmente, a gravidade das mutações prejudiciais varia, o que exige uma ferramenta capaz de graduar o impacto.

Para condições extremamente raras, sem histórico de casos, os métodos tradicionais que dependem da identificação de padrões em grupos de pacientes tornam-se ineficazes.

Em 2021, a equipe criou o EVE, um algoritmo que utiliza padrões evolutivos para classificar mutações em genes de doenças humanas. No entanto, as pontuações do EVE não eram diretamente comparáveis entre genes. O popEVE supera essa limitação ao combinar dados evolutivos

Publicidade

O resultado é um modelo capaz de classificar mutações em todo o proteoma humano, permitindo a comparação direta da gravidade de mutações em diferentes genes. Isso auxilia os médicos a priorizar as variantes mais prejudiciais.

Para validar o popEVE, os pesquisadores analisaram dados genéticos de mais de 31.000 famílias com crianças com distúrbios do desenvolvimento. Em 98% dos casos em que uma mutação causal já havia sido identificada, o popEVE classificou corretamente essa variante como a mais prejudicial no genoma da criança, superando outras ferramentas.

A busca por novos genes candidatos a doenças levou à descoberta de 123 genes nunca antes associados a distúrbios do desenvolvimento, muitos deles ativos no cérebro em desenvolvimento e interagindo fisicamente com proteínas de doenças conhecidas.

O popEVE evita penalizar indivíduos de ancestralidades sub-representadas em bancos de dados genéticos, um problema comum em outras ferramentas que sinalizam mutações como causadoras de doenças simplesmente porque não haviam sido observadas antes.

Publicidade

Os criadores do estudo enfatizam que o popEVE interpreta apenas alterações no DNA que modificam proteínas, e não abrange todos os tipos de variação genética. A ferramenta não substitui o julgamento clínico, e os médicos devem considerar o histórico médico e a análise dos sintomas no diagnóstico.

Compartilhe