Cómo aplicar la Inteligencia Artificial para la búsqueda de la longevidad
Por naturaleza envejecemos y llegado el momento lo más importante es hacerlo de la mejor manera posible. Esto afecta a la globalidad de la población y la ciencia se pone manos a la obra para intentar encontrar esos avances que se acerquen un paso más en la solución.
En concreto la investigación de las afecciones como el cáncer, las enfermedades cardiovasculares o las neurodegenerativas están siendo un área de la medicina que está teniendo un gran auge en la investigación y la aplicación de tecnologías basadas en el Deep Learning y el Machine Learning.
Random forest classification for predicting lifespan-extending chemical compounds 1, es el nombre del paper sobre el que se centra este post y que expone cómo se han implementado algoritmos de aprendizaje automático sobre una extensa base de datos de medicamentos para predecir qué compuestos químicos extienden la vida útil de la Caenorhabditis elegans.
Caenorhabditis elegans
Es una especie de nematodo que ha sido muy utilizado desde los años setenta para diversos estudios genéticos, especialmente en genética del desarrollo. Esto se debe a una serie de características que favorecen su estudio:
Es transparente en todos los estadios de su vida, lo que facilita su observación.
Es una especie hermafrodita favoreciendo así su obtención y mantenimiento de individuos.
Su simpleza genética, con solo 959 células, y un sistema digestivo y nervioso altamente definido.
En laboratorio es fácil de mantener y alimentar.
Su ciclo de vida es relativamente corto (de dos a tres semanas) haciendo posible obtener resultados de los estudios aplicados a cualquier momento de su existencia de una manera rápida.
Es un organismo al que, con relativa facilidad, se puede interrumpir la función de ciertos genes específicos, permitiendo silenciar funciones concretas e inferir su efecto.
Desplazamiento de un C. elegans.
Varios estudios anteriores sobre el envejecimiento han demostrado que ciertas restricciones dietéticas, modificaciones genéticas e intervenciones a través de fármacos pueden extender la vida útil de organismos modelos. Tras la recopilación de las conclusiones obtenidas de dichas investigaciones y basándose en el trabajo de Barardo 2 donde ya construyó un modelo de Random Forest para predecir si un compuesto aumentaría la vida útil de la C. elegance, Kapsiani y Howlin han profundizado en el estudio de los datos de la base de datos DrugAge.
En el estudio que planteamos se han construido cinco modelos predictivos Random Forest cada uno con diferentes tipos de descriptores: huellas dactilares moleculares y/o descriptores moleculares previamente calculados.
La novedad a nivel médico que plantea este trabajo es precisamente la implementación de las huellas dactilares moleculares para construir modelos de aprendizaje automático. En cuanto a la parte más tecnológica de la investigación se han aplicado los algoritmos Random Forest.
Algoritmos Random Forest
Los algoritmos Random Forest o Bosques Aleatorios es una de las técnicas de aprendizaje supervisado. Su base es una combinación de árboles predictores de tal manera que ninguno de los árboles por sí mismo ve todos los datos de entrenamiento, esto hace que cada uno de estos árboles se entrene con distintas muestras de datos para un mismo problema.
Con esta técnica de entrenamientos individuales y combinando sus resultados totales, los errores en las predicciones que pueden surgir por uno de los árboles se compensan con los resultados de los otros y tenemos una predicción que funciona mejor para un problema general.
Flujo de funcionamiento de un Random Forest.Analytics Vidhya
Conclusiones
La principal conclusión de este interesante estudio, más allá de los resultados técnicos que se pueden explorar en su lectura, es que la aplicación de la inteligencia artificial a estudios donde el número de variables es muy alto y se mueve una gran cantidad de datos ofrece unos buenos resultados si se aplica correctamente.
La medicina, como principal referente en los estudios de este tipo está haciendo un uso constante y cada vez mayor de estas técnicas. Tal y como se referencia en esta investigación los resultados son cada vez mejores implicando que los avances médicos sean cada vez más rápidos, impactando directamente en la sociedad, en la salud, en la calidad de vida y por tanto en nuestra longevidad.
Referencias
Kapsiani, S., Howlin, B.J. Random forest classification for predicting lifespan-extending chemical compounds. Sci Rep 11, 13812 (2021) Article Google Scholar
Barardo, D. et al. The DrugAge database of aging-related drugs. Aging Cell 16, 594–597 (2017). CAS PubMed PubMed Central Article Google Scholar