Кукуруза является одной из важнейших основных культур в мире, широко выращивается по всему миру в качестве продукта питания, корма, промышленных материалов, и имеет значительную экономическую ценность. Однако производство кукурузы сталкивается с угрозами из-за различных заболеваний, таких как пятнистости листьев, фузариозная гниль початка и другие. Современные технологии фитосанитарного программного обеспечения, совершенствуясь, предлагают решения для раннего и точного выявления болезней кукурузы.
В последнее время широко исследуются и внедряются подходы, основанные на глубоком обучении, для идентификации болезней сельскохозяйственных культур.
Недавние достижения в области компьютерного зрения и глубокого обучения с целью фитосанитарного мониторинга перспективны, однако многие существующие модели слишком сложны для использования на портативных устройствах, таких как смартфоны или дроны, что ограничивает их практическое применение в полевых условиях.
Китайские исследователи из Аньхойского научно-технологического университета, Центра исследований сельскохозяйственных культур провинции Аньхой и Национального политехнического института (IPN) обратились к этой проблеме, предложив новый подход к распознаванию болезней листьев кукурузы.
Исследование было сосредоточено на разработке «облегчённой» модели — модели, которая обеспечивает высокую точность при минимальных вычислительных ресурсах. Это особенно важно для использования инструментов обнаружения заболеваний непосредственно в сельскохозяйственных условиях. В основе их работы лежит модифицированная версия существующей архитектуры глубокого обучения под названием ShuffleNetV2.
Модели глубокого обучения, как было продемонстрировано в более ранней работе команды с болезнями перца чили, полагаются на выявление закономерностей на изображениях для их классификации.
Однако эти модели часто требуют огромных объёмов данных для обучения и могут быть ресурсоёмкими. Теперь ученые усовершенствовали архитектуру ShuffleNetV2 двумя ключевыми способами.
Во-первых, они внедрили улучшенный механизм внимания, называемый SGSE (Spatial Group-wise Squeeze-and-Excitation Block), сразу после первоначальной обработки изображения. Этот механизм помогает модели сосредоточиться на наиболее важных особенностях изображения, выделяя едва заметные визуальные признаки, указывающие на заболевание. Это основано на идее о том, что эффективное извлечение признаков имеет первостепенное значение для точной идентификации заболевания, как было подчеркнуто в исследовании болезни перца чили.
Во-вторых, они заменили распространённую функцию активации ReLU на ELU (Exponential Linear Unit). Функции активации определяют выход нейрона в нейронной сети; ELU обеспечивает более плавный поток данных в процессе обучения, что потенциально приводит к более быстрым и точным результатам.
Для дальнейшего снижения сложности модели команда использовала метод, называемый «отсечением». Отсечение заключается в удалении ненужных связей в нейронной сети, что сокращает количество требуемых вычислений без существенного влияния на производительность. Эта концепция согласуется с исследованиями по оптимизации моделей глубокого обучения с помощью отсечения, которые продемонстрировали, что удаление связей может фактически улучшить точность за счет фокусировки сети на наиболее релевантных признаках.
В результате, на данный момент исследователи добились сокращения количества параметров на 30,45% и сокращения FLOP (операций с плавающей точкой — мера вычислительной нагрузки) на 30,26% за счет отсечения.
Полученная модель, названная ES-ShuffleNetV2, достигла точности распознавания 97,07% — значительное улучшение по сравнению с точностью базовой модели ShuffleNetV2 в 95,43%. Она также превзошла другие существующие модели с точки зрения как точности, так и F1-Score, метрики, которая объединяет точность и полноту. Этот уровень точности сопоставим, а в некоторых случаях и превосходит результаты, достигнутые с более сложными моделями.
Данное исследование отдает приоритет эффективности и практичности, предоставляя оптимизацию для непосредственного полевого использования фермерами. Эта модель требует намного меньше вычислительных ресурсов, что делает ее пригодной для использования на телефонах или агродронах.
«Тестирование на наборе данных, содержащем шесть типов болезней кукурузы, показало, что предлагаемая модель значительно повышает точность и эффективность распознавания болезней листьев кукурузы, сохраняя при этом свою простоту. Эти результаты открывают новый технический подход к развитию инновационного точного земледелия. Практический набор данных, использованный в данном исследовании, был получен из Аньхойской сельскохозяйственной академии, сбор данных проводился на кукурузных полях, расположенных в северном регионе провинции Аньхой. Для обеспечения достоверности и репрезентативности данных исследовательская группа использовала фотооборудование для съемки пораженных растений кукурузы с разных ракурсов. Условия съемки были сложными: фон включал такие факторы, как солома, почва и сорняки, имитирующие реальные полевые условия. Использовалась камера NIKON D810 с разрешением 1001x1500 пикселей», резюмируют исследователи.
Дальнейшая их работа будет сосредоточена на нескольких аспектах для дальнейшего повышения применимости и эффективности модели ES-ShuffleNetV2.
Одно из направлений предполагает расширение распознавания заболеваний на другие виды сельскохозяйственных культур и проверку обобщения модели с помощью кросс-региональных и кросс-сезонных наборов данных.
Другое будет сосредоточено на включении мультимодальной информации, такой как гиперспектральные данные и факторы окружающей среды, для повышения надежности системы в различных полевых условиях.
Кроме того, будут исследованы простые методы оптимизации, включая квантизацию модели и извлечение знаний, для поддержки развертывания на мобильных или встраиваемых устройствах для мониторинга заболеваний в режиме реального времени.
Наконец, будет дополнительно изучена интерпретируемость модели с использованием Grad-CAM и связанных с ней методов визуализации, чтобы процесс принятия решений моделью стал более прозрачным и полезным для специалистов-агрономов. Ожидается, что эти усилия в совокупности расширят текущее исследование и повысят его практическую ценность в точном земледелии.
Источник: journals.plos.org, doi.org/10.1371/journal.pone.0336945