сегодня в 06:15

Большие данные в сочетании с методами искусственного интеллекта (ИИ) могут значительно повышать точность прогнозов по всему геному пшеницы

ДЗЕН

За последнее десятилетие прогнозирование по всему геному произвело революцию в селекции растений, предоставив оценку генотипической ценности нового сорта-кандидата на основе его геномного профиля и наблюдений за фенотипом родственных генотипов. Это позволяет исключить некоторые дорогостоящие полевые испытания, поскольку ранние стадии селекционных испытаний с низкой наблюдаемой наследуемостью можно заменить с помощью геномного прогнозирования. Таким образом, время, необходимое для выбора превосходных генотипов, может быть сокращено даже для сложных признаков, контролируемых многими генами.

Большие объемы данных («большие данные») предлагают огромный потенциал для повышения точности прогнозов по всему геному в селекции растений. Воодушевленные успешными результатами с гибридами пшеницы, исследователи из Института генетики растений и исследований сельскохозяйственных культур имени Лейбница (Leibniz Institute of Plant Genetics and Crop Plant Research, IPK), теперь распространили этот подход на так называемые инбредные линии.

Впервые они объединили фенотипические и генотипические данные из четырех коммерческих программ по селекции пшеницы. Результаты исследования опубликованы в журнале Plant Biotechnology Journal.

Методы глубокого обучения стали играть все более важную роль в геномном прогнозировании в последние годы. В отличие от традиционных методов, подходы глубокого обучения работают с гибкими, нелинейными преобразованиями входных данных. Цель состоит в том, чтобы распознавать закономерности в данных и связывать их с наблюдаемыми характеристиками, такими как урожайность или высота растений.

Параметры, необходимые для этого, оптимизируются на основе обширных данных обучения. Такие методы обещают особые преимущества, когда характеристики растений сильно зависят от сложных взаимодействий, которые недостаточно учитываются в традиционных моделях.

В этом контексте исследовательская группа IPK взяла на себя роль попечителя академических данных и объединила данные четырех программ по селекции пшеницы с экспериментальными данными более ранних государственно-частных партнерств.

«Нам нужны были данные по многим генотипам, которые уже были протестированы в разных условиях, т. е. в разных местах», - объясняет профессор, доктор Йохен Райф, руководитель отдела «Исследования селекции» в IPK.

Новый набор данных охватывал 12 лет испытательной деятельности в 168 средах и сформировал обучающий набор для геномных прогнозов с 9500 генотипами, включая урожайность зерна, высоту растения и дату колошения. Одной из основных проблем было объединение различных данных и, в конечном итоге, обеспечение их сопоставимости.

«Несмотря на неоднородную фенотипическую и генотипическую информацию, нам удалось использовать хранилища данных компаний и получить связываемые данные посредством тщательной подготовки данных, включая подстановку отсутствующих однонуклеотидных полиморфизмов», - говорит профессор, доктор Райф.

Команда использовала эти данные для сравнения классических методов геномного прогнозирования с подходами глубокого обучения на основе нейронных сетей. С помощью нейронных сетей удалось распознать закономерности в структурированных данных.

«Наши анализы показали, что различные серии тестов можно гибко комбинировать для геномных прогнозов, и что точность прогноза непрерывно улучшается по мере увеличения размера обучающего набора - по крайней мере, до примерно 4000 генотипов», - объясняет Мориц Лелль, первый автор исследования. Если обучающий набор увеличивается еще больше, значения прогноза увеличиваются лишь незначительно.

«Однако мы предполагаем, что это плато можно преодолеть, если мы включим в набор данных значительно больше сред, - подчеркивает профессор доктор Райф. - Это позволило бы еще лучше использовать потенциал больших данных в селекционных исследованиях».

Источник: Leibniz Institute of Plant Genetics and Crop Plant Research.

Заглавное фото: Лукьянов Дмитрий, AgroXXI.ru.

МАТЕРИАЛЫ ПО ТЕМЕ