сегодня в 07:13

Ученых-реконструкторов микробной эволюции защитили от галлюцинаций в Big Data. Что это означает для агронауки

ДЗЕН

В эпоху больших данных преобладает мнение, что чем больше информации, тем лучше ответы. Однако новое исследование показывает, что в поисках древних предков жизни больше данных на самом деле может привести к меньшему количеству истины. Исправленное генеалогическое древо микробных семейств предлагает статистически обоснованную модель эволюции самых ранних форм жизни – архей. Новый метод позволяет отсеять ложные «галлюцинации» алгоритмов Big Data. Например, агробиологи теперь могут точно воссоздать эволюционную карту полезных почвенных архей, выделив стабильные генетические модули, которые реально отвечают за выживание растений в экстремальных условиях.

Исследование, опубликованное в журнале Proceedings of the National Academy of Sciences, проведенное доцентом кафедры компьютерных наук Университета Монреаля Миклошем Чюрёшем, показывает, что стандартные методы реконструкции геномов древних микробов (архей) не справляются с взрывным ростом объема информации.

Как показывает исследование, этот парадокс приводит к тому, что современные модели «галлюцинируют» эволюционные события — в частности, невероятно большое количество горизонтальных переносов генов, — которые на самом деле являются всего лишь статистическими призраками.

В статье Чюрёш указывает на кризисную точку в эволюционной биологии: когда исследователи пытаются согласовать тысячи последовательностей генов по всему древу жизни, фактический эволюционный сигнал начинает исчезать, уступая место математическому шуму.

«Традиционные инструменты пытаются отслеживать каждую отдельную мутацию и обмен, но в таком масштабе сигнал обрывается. Это как пытаться читать книгу, где чернила размазаны; если слишком сильно увеличить масштаб, буквы полностью пропадают», — сказал Чюрёш. 

Проще говоря, традиционные инструменты (например, метод ALE) пытаются отследить каждую отдельную мутацию и обмен участками ДНК. При масштабном анализе тысяч современных микробов этот подход сбоит: алгоритмы начинают ошибочно регистрировать аномально высокое количество горизонтальных переносов генов там, где их не было, и рисовать микроскопические геномы у древнейших предков.

Для решения этой проблемы Чюрёш разработал концепцию GLD (Gain-Loss-Duplication). Вместо того чтобы теряться в «размытых чернилах» отдельных последовательностей, GLD фокусируется на демографических характеристиках семейств генов — отслеживая, как они появляются, как исчезают и как распространяются во времени.

По словам ученого, благодаря использованию надежных вычислений вероятности и отстранению от шума индивидуальных вариаций, структура GLD обеспечивает более четкую и стабильную карту прошлого: «Преодолевая сложные математические вычисления процессов рождения и смерти, она становится мощным инструментом для геномной археологии».

Как обнаружил Чюрёш, применение GLD к огромному набору данных из 269 геномов архей позволило скорректировать искаженные результаты предыдущих громких исследований. Исследование показало, что эволюция архей — это не хаотичный обмен генами, а тонко сбалансированное и динамичное равновесие.

Равновесие состоит из трех компонентов, где первый — это закулисная борьба. Большая часть жизни генома проходит в высокочастотном цикле оптимизации (постоянная «утечка» отдельных генов), уравновешиваемом повсеместным притоком транзитных генов. 

Исследование показало, что на каждое стабильное семейство генов приходится в шесть раз больше транзитных генов, проходящих через него — открытие, ставшее возможным благодаря новому математическому методу, который корректирует предвзятость, возникающую при рассмотрении только общих генов.

Второй аспект сосредоточен на адаптивных модульных потерях. Помимо случайного фонового шума, исследование выявило модульные закономерности, при которых целые наборы функциональных генов удаляются одновременно. Это не случайность, а стратегические адаптации. Например, когда древний микроб меняет свой рацион, он в результате скоординированного эволюционного действия избавляется от всего биологического механизма, который ему больше не нужен.

Третий тип включает в себя прерывистые масштабные увеличения численности. Эти потери чередуются с редкими, но масштабными всплесками нового генетического материала. Эти события выступают в роли «эволюционных основателей», предоставляя сырье, позволяющее новым классам организмов — таким как галобактерии — процветать в совершенно новых средах.

Прим.ред. Отметим, что сегодня галобактерии имеют огромное значение для сельского хозяйства, особенно в условиях глобального изменения климата и нарастающего кризиса засоления почв. Хотя их название содержит корень «бактерии», с точки зрения современной науки это археи (Halobacteria/Haloarchaea) — те самые экстремофилы, изучению эволюции которых посвящены математические модели Миклоша Чюрёша. Они живут в средах с экстремально высокой концентрацией соли (солончаки, пересохшие моря, соленые озера). Для сельского хозяйства галобактерии и их генетические механизмы важны в четырех ключевых направлениях:

1. Спасение культур от солевого стресса (биоремедиация почв)

Из-за неправильного орошения и изменения климата миллионы гектаров пахотных земель по всему миру превращаются в солончаки, где обычные растения погибают из-за осмотического шока. Галобактерии выработали уникальную стратегию «salt-in» — они накапливают внутри своих клеток ионы калия (K⁺), чтобы уравновесить высокую концентрацию натрия (Na⁺) снаружи. Обработка семян и корней биопрепаратами на основе галобактерий помогает культурным растениям (например, рису или пшенице) выдерживать высокий уровень соли в почве, удерживая влагу внутри растительных клеток.

2. Доноры генов для стрессоустойчивой биоинженерной селекции

Методы геномной археологии и биоинформатики позволяют ученым находить у галобактерий стабильные эволюционные модули генов, отвечающие за выживание.

Генетики успешно переносят отдельные гены галобактерий (например, гены, кодирующие специальные белки-шапероны или ионные насосы) в геном сельскохозяйственных культур. Модифицированные таким образом растения приобретают способность давать стабильный урожай, используя для полива даже солоноватую или морскую воду.

3. Биостимуляторы роста растений (PGP-агенты)

Многие виды галобактерий умеют выживать не просто в соленой воде, а непосредственно в прикорневой зоне (ризосфере) растений-галофитов. В процессе жизнедеятельности эти археи переводят трудноусвояемый почвенный фосфор в растворимую форму, фиксируют азот и синтезируют фитогормоны (например, индолил-3-уксусную кислоту). Использование галобактерий в качестве «живого удобрения» позволяет стимулировать рост культурных растений на бедных, деградировавших и засоленных почвах.

4. Производство экологичных биопластиков для агросектора

Галобактерии (в частности, виды рода Haloferax) способны синтезировать полигидроксиалканоаты (ПГА) — натуральный полимер, заменяющий пластик. Из этого материала изготавливают биоразлагаемые укрывные пленки для полей, капсулы для пролонгированного высвобождения удобрений и экологичную упаковку. В отличие от обычного пластика, ПГА-пленка после сбора урожая полностью разлагается почвенными микробами, не загрязняя землю микропластиком.

Доказав, что в отношении филогенетического сигнала принцип «меньше — значит больше», Чюрёш заявил, что его исследование предоставляет «новую, статистически обоснованную основу для понимания того, как эволюционировали самые ранние формы жизни на Земле».

«Это обеспечивает важнейший механизм контроля качества для следующего поколения эволюционных исследований, гарантируя, что мы не примем шум больших данных за сигнал истории жизни», заключил он.

По статье Джеффа Хайнриха из Университет Монреаля.

МАТЕРИАЛЫ ПО ТЕМЕ