Clear Sky Science · es
Evaluación de la profundidad de secuenciación shotgun revela el potencial y las limitaciones de la metagenómica superficial y el análisis a nivel de cepa
Por qué observar la vida microscópica requiere el tamaño de datos adecuado
Los microbios que viven en nosotros y sobre nosotros condicionan nuestra salud, pero son demasiado pequeños y diversos para contarlos al microscopio. Hoy, los científicos suelen leer su ADN para saber qué microbios están presentes y qué pueden hacer. Pero más datos de ADN implican mayores costes. Este estudio plantea una pregunta simple pero importante: ¿cuánta secuenciación de ADN es realmente necesaria para obtener respuestas útiles sobre una comunidad microbiana, y en qué punto recortar recursos empieza a inducir a error?

Evaluando la potencia de datos pequeños y grandes
Los investigadores construyeron comunidades microbianas artificiales a partir de bacterias intestinales conocidas cultivadas en el laboratorio. Porque sabían exactamente qué cepas estaban presentes y en qué cantidades, estas muestras “simuladas” actuaron como un patrón de prueba para una pantalla de televisión, revelando dónde la imagen derivada de la secuenciación de ADN era nítida o borrosa. Secuenciaron cada comunidad a profundidades que iban desde una cantidad muy pequeña de datos hasta niveles muy grandes, y luego analizaron qué bacterias podían detectar, si podían distinguir cepas estrechamente relacionadas y cuánto del potencial proteico de cada cepa podían recuperar.
Qué funciona bien con poca secuenciación
Para preguntas básicas como “qué especies están aquí” y “qué tan comunes es cada una”, el equipo halló que se necesitaba sorprendentemente poca información cuando existían buenos genomas de referencia. Incluso a baja profundidad de secuenciación, cada cepa dejaba una huella detectable, y los patrones de abundancia relativa se mantuvieron estables a medida que se añadían más datos. Alrededor de medio gigabase por muestra fue suficiente para perfilar de forma fiable la composición de la comunidad. Esto hace que la secuenciación de baja profundidad, o “superficial”, sea atractiva para estudios grandes que quieran comparar patrones generales del microbioma entre muchas personas o condiciones sin gastar una fortuna.
Dónde las aproximaciones superficiales se quedan cortas
Los problemas surgieron cuando el foco pasó de las especies a las cepas individuales y sus funciones detalladas. Reconstruir genomas enteros desde cero, un proceso conocido como ensamblado de metagenomas, requirió mucha más secuenciación y aun así con frecuencia falló. Los programas informáticos agruparon fragmentos de ADN en genomas provisionales que parecían de alta calidad según listas de control estándar, pero muchos de estos eran en realidad mosaicos formados por varias cepas diferentes. Incluso a profundidades de secuenciación muy altas, una proporción notable de estos genomas ensamblados resultaron ser quiméricos, y algunas cepas verdaderas se pasaron por alto por completo. La secuenciación superficial también tuvo dificultades para capturar el conjunto completo de proteínas presentes: mientras que unos pocos gigabases fueron suficientes para bosquejar rutas metabólicas generales, se necesitó una secuenciación mucho más profunda para cubrir la mayoría de las proteínas individuales, especialmente en comunidades más complejas.

Efectos de decisiones de laboratorio y ADN circunstancial
El estudio también mostró que los pasos previos a que el ADN llegue al secuenciador pueden sesgar los resultados, especialmente cuando la profundidad de secuenciación es baja. Usar más ADN inicial y menos rondas de amplificación hizo que los perfiles taxonómicos y funcionales fueran más robustos. En contraste, los protocolos con poco ADN de entrada y muchas rondas de amplificación distorsionaron la abundancia relativa de algunas cepas. Añadir ADN del hospedador, imitando lo que ocurre con muestras ricas en material humano o animal, redujo además la cobertura aparente de los genomas microbianos y sus proteínas. Estos problemas se volvieron menos graves a mayores profundidades de secuenciación, pero no desaparecieron por completo.
Orientación práctica para futuros estudios del microbioma
En conjunto, el trabajo ofrece un control de realidad sobre lo que la secuenciación de ADN superficial puede y no puede ofrecer. Para estudios que principalmente necesitan un censo amplio de qué microbios están presentes en un entorno bien estudiado como el intestino humano, profundidades de secuenciación modestas pueden funcionar bien, siempre que existan buenos genomas de referencia y se elijan cuidadosamente los protocolos de laboratorio. Sin embargo, para preguntas detalladas sobre las funciones de una comunidad o las diferencias a escala fina entre cepas, la secuenciación superficial no es suficiente. Incluso la secuenciación muy profunda no puede arreglar por completo el problema de los genomas ensamblados mezclados, por lo que los resultados basados en esos borradores deben tratarse con cautela. En resumen, la cantidad de datos de ADN y los métodos de análisis deben ajustarse a la pregunta científica, con una comprensión clara de dónde la imagen sigue siendo borrosa.
Cita: Treichel, N.S., Pauvert, C., Séneca, J. et al. Benchmarking of shotgun sequencing depth reveals the potential and limitations of shallow metagenomics and strain-level analysis. Nat Microbiol 11, 1233–1244 (2026). https://doi.org/10.1038/s41564-026-02334-2
Palabras clave: secuenciación del microbioma, metagenómica superficial, profundidad de secuenciación, genomas ensamblados de metagenomas, análisis a nivel de cepa