Como aplicar a Inteligência Artificial na busca da longevidade
Envelhecemos por natureza e, quando chegar a altura, o mais importante é fazê-lo da melhor maneira possível. Isto afeta a população como um todo, e a ciência está a trabalhar arduamente para tentar encontrar os avanços que nos aproximarão um passo da solução.
Especificamente, a investigação em condições como o cancro, doenças cardiovasculares ou neurodegenerativas é uma área da medicina que está a experimentar um boom na investigação e na aplicação de tecnologias baseadas em Deep Leaning a Machine Learning.
Random forest classification for predicting lifespan-extending chemical compounds 1, é o nome do artigo em que este post se concentra e que explica como os algoritmos de aprendizagem automática foram implementados numa extensa base de dados de medicamentos para prever que compostos químicos prolongam a vida útil de Caenorhabditis elegans.
Caenorhabditis elegans
Caenorhabditis elegans é uma espécie de nemátodo que tem sido amplamente utilizada desde os anos 70 para vários estudos genéticos, especialmente em genética de desenvolvimento. Isto deve-se a uma série de características que favorecem o seu estudo:
Deslocação de um C. elegans.
Vários estudos anteriores sobre o envelhecimento mostraram que certas restrições alimentares, modificações genéticas e intervenções medicamentosas podem prolongar a duração de vida dos organismos modelo. Depois de compilar os resultados destes estudos e de se basear no trabalho de Barardo 2, onde ele construiu um modelo da Random Forest para prever se um composto aumentaria a vida útil de C. elegans, Kapsiani e Howlin estudaram mais aprofundadamente os dados da base de dados da DrugAge.
No nosso estudo, foram construídos cinco modelos preditivos de Random Forest, cada um com diferentes tipos de descritores: impressões digitais moleculares e/ou descritores moleculares pré-calculados.
A novidade deste trabalho a nível médico é precisamente a implementação de impressões digitais moleculares para construir modelos de aprendizagem de máquinas. Em termos da parte mais tecnológica da investigação, foram aplicados os algoritmos Random Forest.
Algoritmos Random Forest
Os algoritmos random forest são uma das técnicas de aprendizagem supervisionada. A sua base é uma combinação de árvores preditoras de tal forma que nenhuma das árvores por si só vê todos os dados de formação, de modo que cada uma destas árvores é treinada com diferentes amostras de dados para o mesmo problema.
Com esta técnica de treino individual e combinando os seus resultados totais, os erros nas previsões que podem surgir para uma das árvores são compensados pelos resultados das outras e temos uma previsão que funciona melhor para um problema global.
Fluxo de funcionamento de um Random Forest.Analytics Vidhya
Conclusões
A principal conclusão deste interessante estudo, para além dos resultados técnicos que podem ser explorados na sua leitura, é que a aplicação da inteligência artificial a estudos em que o número de variáveis é muito elevado e em que uma grande quantidade de dados está envolvida oferece bons resultados se aplicada corretamente.
A medicina, como principal referência em estudos deste tipo, está a fazer um uso constante e crescente destas técnicas. Como esta investigação demonstra, os resultados são cada vez melhores, o que significa que os avanços médicos estão a tornar-se cada vez mais rápidos, tendo um impacto direto na sociedade, na saúde, na qualidade de vida e, portanto, na nossa longevidade.
Referências
Kapsiani, S., Howlin, B.J. Random forest classification for predicting lifespan-extending chemical compounds. Sci Rep 11, 13812 (2021) Article Google Scholar
Barardo, D. et al. The DrugAge database of aging-related drugs. Aging Cell 16, 594–597 (2017). CAS PubMed PubMed Central Article Google Scholar