El ensamblaje de genomas de novo (es decir, sin referencia previa), una de las tareas más complejas de la bioinformática moderna, ha dado un paso adelante gracias a la investigación desarrollada en la Universidad de Málaga. La secuenciación “de novo” e asemeja a tomar varias cintas antiguas de un mismo álbum, cortarlas en trozos aleatorios y tratar de recomponer la obra original sin haberla escuchado previamente. La tesis doctoral titulada “High-performance computing in bioinformatics: accelerating de novo assembly”, defendida por Elena María Espinosa García en el Programa de Doctorado en Tecnologías Informáticas, fue calificada sobresaliente cum laude y propone nuevas herramientas de aceleración software y hardware para mejorar la eficiencia del proceso de secuenciación genómica.

Dirigida por los profesores Óscar Plata González, miembro del Instituto Universitario de Investigación en Ingeniería Mecatrónica y Sistemas Ciberfísicos (IMECH.UMA), y Rafael Larrosa Jiménez, la investigación combina supercomputación, algoritmos avanzados y hardware reconfigurable para abordar uno de los mayores desafíos de la genómica actual: el tiempo y el coste energético del ensamblaje de ADN.
La tesis se ha desarrollado utilizando el supercomputador Picasso del Centro de Supercomputación y Bioinformática (SCBI), nodo de la Red Española de Supercomputación (RES), lo que ha permitido analizar y optimizar los algoritmos más prometedores de secuenciación de novo —aquellos capaces de reconstruir un genoma sin una referencia previa.

Entre las aportaciones más destacadas se encuentra la mejora del algoritmo de Myers, ampliamente utilizado en la comparación de secuencias, mediante la incorporación de extensiones vectoriales AVX de Intel que aceleran significativamente su ejecución. Además, gracias a la colaboración internacional con la EPFL (Suiza), la doctoranda desarrolló una implementación sobre FPGA, que permite reducir considerablemente el consumo energético, manteniendo o superando la velocidad de ejecución de las versiones basadas en CPU y GPU.
Los resultados han dado lugar a dos herramientas innovadoras:
- Un acelerador basado en AVX-512 diseñado para optimizar el algoritmo de Myers.
- Una versión ampliada sobre FPGA que mejora tanto la velocidad como la eficiencia energética del proceso de ensamblaje.
Según el codirector de la tesis, Rafael Larrosa Jiménez,
“La medicina personalizada necesita un análisis realmente individual. Con este trabajo se avanza hacia un ensamblaje genómico único para cada persona u organismo, reduciendo el tiempo y la energía necesarias.”
El desarrollo de esta investigación no solo supone un avance en el procesamiento inteligente de datos genómicos, sino que también ejemplifica la creciente colaboración entre la ingeniería y las ciencias de la vida. En este sentido, la cooperación entre el IMECH.UMA y el SCBI de la Universidad de Málaga refuerza la apuesta de la institución por la investigación interdisciplinar aplicada.
Cobertura oficial de la noticia en la sala de prensa de la UMA: https://www.uma.es/sala-de-prensa/noticias/la-innovacion-en-la-secuenciacion-genomica-de-novo-desde-la-uma-promete-avances-en-medicina-personalizada/