Clear Sky Science · es
Basecaller de ADN reprogramable y de bajo consumo con un acelerador HMM eficiente para secuenciación por nanoporo en tiempo real
Por qué los secuenciadores de ADN diminutos necesitan chips más inteligentes
Los secuenciadores de ADN del tamaño de la palma de la mano ya pueden leer un genoma humano en horas en lugar de años, abriendo posibilidades para diagnósticos junto a la cama del paciente, el seguimiento de brotes y la biología de campo lejos de grandes laboratorios. Pero, aunque el hardware de sensado se ha vuelto pequeño y rápido, la computación necesaria para convertir los garabatos eléctricos en las letras A, C, G y T sigue consumiendo mucha energía. Este artículo describe un chip personalizado de bajo consumo que realiza este paso de traducción —llamado llamado de bases— de forma mucho más eficiente, haciendo que el análisis de ADN en tiempo real y alimentado por batería sea más práctico.
De los garabatos eléctricos al código genético
Los secuenciadores modernos por nanoporo hacen pasar hebras de ADN por un pequeño orificio y miden cómo cambia el flujo de iones a medida que las bases pasan. En lugar de cuatro niveles de señal limpios, el dispositivo produce una serie temporal ruidosa en la que cada lectura refleja varias bases vecinas a la vez. Eso convierte la decodificación en un problema de reconocimiento de patrones bajo fuerte ruido. Los algoritmos de llamado de bases deben filtrar estas señales fluctuantes e inferir qué segmentos de ADN tuvieron más probabilidad de producirlas, porque todos los pasos posteriores —como ensamblar genomas o encontrar mutaciones— dependen de que este primer paso se haga bien.

Una hoja de ruta probabilística para señales ruidosas
Los autores se basan en una técnica llamada Modelo Oculto de Markov, que trata la decodificación del ADN como un desplazamiento a través de una red de posibles patrones cortos de bases mientras se observa la señal entrante. Cada estado en esta red corresponde a un pequeño bloque de bases, y las transiciones entre estados representan cómo la hebra de ADN puede deslizarse por el nanoporo. Usando el algoritmo de Viterbi, el sistema busca la ruta más probable a través de esos estados que podría haber producido la señal observada. Este enfoque resulta atractivo para hardware: es matemáticamente riguroso, maneja el ruido de forma natural y puede ampliarse añadiendo más estados, y sus operaciones básicas —sumar, comparar y almacenar puntuaciones numéricas— son lo bastante simples como para implementarlas en silicio.
Diseñar un motor de llamado de bases esbelto y reutilizable
Una implementación de hardware directa dedicaría circuitería separada a cada estado posible y a cada transición posible, ofreciendo alta velocidad pero un chip muy grande y consumidor de energía. En su lugar, los autores introducen una arquitectura serial-paralela que reutiliza bloques más pequeños a lo largo del tiempo. Primero diseñan una unidad de procesamiento eficiente de 16 estados y luego aplican un cronograma y compartición ingeniosos para que ese bloque pueda manejar un modelo completo de 64 estados e incluso reutilizarse repetidamente para soportar hasta 4096 estados cuando sea necesario. Trucos clave incluyen organizar las transiciones de estado de modo que muchos estados compartan la misma unidad aritmética, descomponer comparaciones grandes en etapas pequeñas de cuatro entradas y precomputar funciones costosas como logaritmos fuera del chip. En conjunto, estas elecciones sacrificarían un aumento moderado en los ciclos de procesamiento a cambio de una reducción drástica de la circuitería.
Equilibrando velocidad, precisión y duración de la batería
Fabricado en un proceso de 130 nanómetros estándar, el basecaller propuesto procesa alrededor de 8 millones de bases de ADN por segundo —lo bastante rápido para seguir la secuenciación en tiempo real— mientras consume solo 200 miliwatts de potencia. Su precisión de decodificación (94,3 %) supera a varias herramientas de software que usan el mismo enfoque de modelado y aventaja ligeramente a un acelerador de hardware previo, a la vez que emplea entre cuatro y seis veces menos energía que muchos diseños competidores. En comparación con los llamados de bases basados en aprendizaje profundo, que alcanzan unos pocos puntos porcentuales más de precisión pero exigen vatios de potencia y hardware complejo, este chip sacrifica algo de rendimiento máximo a cambio de una operación más simple, predecible y energéticamente eficiente. Mediciones y simulaciones confirman que la aritmética de punto fijo es lo bastante precisa para igualar los resultados de referencia en punto flotante cuando se configura con anchuras de bits adecuadas.

Hacia la genómica de bolsillo
Para los no especialistas, la conclusión principal es que este trabajo acerca la decodificación del ADN a algo que puede ejecutarse dentro de un dispositivo del tamaño de un teléfono o un analizador apto para campo sin depender de ordenadores voluminosos o procesadores gráficos consumidores de energía. Al remodelar cuidadosamente un método estadístico bien conocido en un motor de hardware compacto y reutilizable, los autores demuestran que es posible leer genomas de forma rápida, precisa y con un uso de energía frugal. En el futuro, imaginan combinar este enfoque con técnicas de aprendizaje profundo más ligeras, pero incluso en su forma actual, el chip ofrece una base sólida para sistemas de secuenciación de ADN móviles y embebidos de próxima generación.
Cita: Shahraki, A.S., Magierowski, S., Abbasi, M. et al. Low power reprogrammable DNA basecaller with an efficient HMM accelerator for real time nanopore sequencing. Sci Rep 16, 11425 (2026). https://doi.org/10.1038/s41598-026-41649-2
Palabras clave: secuenciación por nanoporo, llamado de bases de ADN, hardware de bajo consumo, Modelo Oculto de Markov, acelerador ASIC