Clear Sky Science · ru
Секвенирование генома, де-ново сборка и аннотация коммерчески важного бамбука Bambusa tulda Roxb
Быстрорастущая трава с большим потенциалом
Бамбук может выглядеть как простое садовое растение, но на самом деле это мощный природный ресурс для строительства, производства бумаги и даже будущих биотоплив. Один из широко используемых видов, Bambusa tulda или бенгальский бамбук, быстро растёт, запасает большое количество древесного материала и цветёт очень редко. До сих пор у учёных не было полного «инструкционного пособия» по этому виду. В этой статье описано, как исследователи расшифровали и организовали полную последовательность ДНК B. tulda, создав базовый ресурс, который поможет совершенствовать бамбук для промышленности, охраны природы и климатически ориентированных технологий.
Зачем расшифровывать ДНК бамбука?
Bambusa tulda широко распространён на Индийском субконтиненте и в частях Юго-Восточной Азии, где прочные стебли (чулмы) используются в сельском строительстве, мебели и народных промыслах. Он также вызывает интерес как источник бумажной массы и возобновляемой энергии. Тем не менее B. tulda ведёт себя загадочно: он может очень быстро расти, накапливать большое количество жёсткой древесины и затем ждать примерно 50 лет перед цветением, причём иногда все растения в районе цветут одновременно. Без полного секвенирования генома учёные могли лишь предполагать, какие гены контролируют эти свойства. Прочитав и собрав его ДНК, авторы поставили цель создать эталонную карту, которой будущие исследователи смогут пользоваться при изучении роста, цветения, устойчивости к болезням и других признаков.

Измерение и чтение гигантского генома
Команде сначала нужно было понять, насколько велик геном B. tulda. С помощью метода, называемого проточной цитометрией, они сравнили содержание ДНК в клетках листьев B. tulda с томатом и кукурузой — двумя растениями с уже известными размерами геномов. Это указало на диплоидный размер генома примерно в 3 миллиарда «букв» ДНК. Затем они применили второй независимый подход на основе перекрытий коротких фрагментов ДНК (k-mer анализ), который оценил немного меньший размер — примерно 2,34 миллиарда букв — и показал, что значительная часть генома повторяющаяся и, вероятно, дублирована. Имея эти оценки, они выделили очень длинную, высококачественную ДНК из молодых листьев и секвенировали её с помощью современной технологии PacBio HiFi, получив более 116 миллиардов оснований сырьевых данных — достаточно, чтобы прочитать геном десятки раз.
Собирая бамбуковый чертёж
Преобразовать миллионы считываний ДНК в упорядоченный геном — всё равно что собрать огромную головоломку без картинки на коробке. Исследователи использовали специализированное программное обеспечение, чтобы создать как объединённую первичную сборку, так и две отдельные гаплотипные сборки, отражающие две родительские копии генома. После удаления дублирующихся и органелл-родственных фрагментов они получили упрощённую «гаплоидную» сборку из 43 крупных сегментов, охватывающую около 1,37 миллиарда оснований. Эти сегменты делятся на три субгенома, обозначенные как A, B и C, что соответствует сложному полиплоидному происхождению B. tulda. Широко используемый тест качества BUSCO показал, что примерно 99% ожидаемых генов растений присутствуют и сохранены, указывая на то, что сборка как полная, так и надёжная для дальнейших исследований.
Гены, повторы и эволюционные подсказки
После сборки генома следующим шагом было выявление его рабочих компонентов. Сочетая три источника доказательств — предсказания по самой последовательности ДНК, сходство с генами других бамбуков и данные РНК о реально экспрессируемых генах — команда аннотировала 56 890 кодирующих белок генов, которые занимают примерно пятую часть генома. Они также задокументировали большое количество некодирующих РНК, включая более тысячи тРНК и рРНК, поддерживающих синтез белка. Поразительно, что около двух третей генома составляют повторяющиеся элементы, особенно мобильные участки ДНК, которые копируются и перемещаются. Эти повторы помогают объяснить расхождения ранних оценок размера и указывают на динамичную эволюционную историю. Сравнение белковых семейств с двенадцатью другими видами бамбука, а также с кукурузой и бананом в качестве родственников, отнесло B. tulda к группе палеотропических древесных бамбуков с гексаплоидным фоном, подтвердив, что его геном сложен из нескольких предковых копий.

Новая основа для будущих исследований бамбука
Для неспециалистов главный результат в том, что у B. tulda теперь есть высококачественный референсный геном — индексированная, доступная для поиска карта его ДНК. Этот ресурс позволит учёным сфокусироваться на генах, контролирующих быстрый рост, одревеснение и задержанное цветение, и сопоставлять их с другими злаками. Он также поддержит усилия по селекции или генной инженерии бамбуковых сортов, лучше подходящих для строительства, производства бумаги или энергетики, при сохранении естественных популяций. Короче говоря, проследив генетический ландшафт этого коммерчески важного бамбука, исследование создаёт основу для более разумного использования одного из самых универсальных растений в мире.
Цитирование: Kundu, S., Rupp, O., Dey, S. et al. Genome sequencing, de novo assembly and annotation of the commercially important bamboo, Bambusa tulda Roxb. Sci Data 13, 175 (2026). https://doi.org/10.1038/s41597-026-06679-5
Ключевые слова: геном бамбука, Bambusa tulda, генетика растений, древесные злаки, возобновляемые биоматериалы