Исследователи из Дании (Кафедра агроэкологии, Орхусский университет; Agro Intelligence ApS) сообщили в своей работе, опубликованной в журнале Agronomy 2022 на портале MDPI, что искусственный интеллект, благодаря научным усилиям, продолжает совершенствоваться и есть варианты распознавания сорняков с повышенной точностью.
«Борьба с сорняками играет фундаментальную роль в повышении урожайности и, следовательно, увеличении доходов. – Пишут авторы. - Вручную картировать популяцию сорняков на гектарах полей трудоемко, отнимает много времени и часто не дает достоверной картины. А опрыскивание всех растений подряд экономически расточительно.
В современных исследованиях используются три подхода к борьбе с сорняками: физический, биологический и химический подходы. И везде нужна информация о типах сорняков, их количестве, стадии роста и т. д. Собрав эту информацию, создается точная карта сельскохозяйственных угодий, которая нужна для борьбы с сорняками на конкретном участке.
Точные обработки приводят к снижению и / или оптимальности смеси и дозы гербицидов, которые одновременно эффективны и безвредны для окружающей среды. Современные технологии в основном сосредоточены на автономном обнаружении сорняков с более высокой точностью и меньшим экологическим загрязнением.
В последнее время использование продвинутого компьютерного зрения и методов глубокого обучения значительно расширилось за счет усовершенствований графических процессоров (GPU).
Графические процессоры позволяют искусственном интеллекту учиться на большом количестве данных, что необходимо для получения высоких уровней точности.
Современные технологии компьютерного зрения и глубокого обучения демонстрируют многообещающие результаты в задачах классификации и обнаружения сорных растений. В частности, в области сельского хозяйства предлагаемые методы дают замечательную интерпретацию сорняков (включая тип и количество).
Существует три основных метода обнаружения объектов в компьютерном зрении: семантическая сегментация, обнаружение экземпляров и обнаружение ограничивающей рамки. Семантическая сегментация показывает выдающиеся результаты при прогнозировании состава биомассы благодаря классификации изображений по пикселям.
Однако попиксельная классификация требуется для высокоточных методов борьбы с сорняками, таких как физическое управление. На полях с сильной окклюзией подсчет количества сорняков затруднен.
Таким образом, сегментация экземпляров используется в приложениях для обнаружения мелких сорняков, таких как прополка типа электрификации, чтобы также определить количество сорняков на каждом квадратном метре.
При обнаружении сорняков с использованием ограничительных рамок оцениваются местонахождение сорняков и виды. Кроме того, стадии роста сорняков прогнозируются на основе размера ограничивающих рамок.
Обнаружение сорняков с использованием ограничительной рамки - это основная информационная база для оптимизации интегрированной борьбы с сорняками (IWM).
Поскольку сверточные нейронные сети особенно демонстрируют выдающиеся характеристики в области компьютерного зрения, в современных работах наблюдается высокая тенденция к обнаружению и классификации сорняков с использованием алгоритмов глубокого обучения.
В то время как технология глубокого обучения сильно зависит от большого количества изображений, маркировка данных - трудоемкая процедура. С другой стороны, несбалансированные по классам наборы данных смещают сеть в сторону класса с большинством экземпляров, что приводит к большей неопределенности для модели. Синтетически сгенерированные данные улучшают производительность модели за счет увеличения помеченных данных, обеспечивают баланс между количеством изображений в разных классах и приводят к модели с лучшим обобщением реальных изображений в полевых условиях.
Синтетические данные с высоким сходством с реальными полевыми изображениями являются хорошей альтернативой или дополнением к реальным полевым данным без меток.
Общие предлагаемые исследования, основанные на синтетических данных, делятся на три группы в зависимости от того, как генерируются синтетические данные: метод вырезания и вставки, графическое моделирование и генеративно-состязательные сети (GAN).
Выбранные образцы для генерации данных произвольно поворачиваются, масштабируются и насыщаются перед вставкой в фон почвы. Ядро Гаусса было принято для создания тени и создания иллюзии глубины в смоделированных изображениях.
Метод вырезания и вставки — простой и эффективный метод создания синтетических данных.
Во второй категории графическое моделирование (например, L-система) используется для создания синтетических изображений.
В третьей категории для формирования синтетических данных нужны две сети: одна как генератор, а другая как дискриминатор для удаления плохих выборок. Однако GAN имеет значительно более низкую точность по сравнению с двумя предыдущими методами.
Многие из предложенных алгоритмов обнаружения растений работают для случаев, когда растения хорошо отображены и не было окклюзии, и одной из заметных проблем в наборе сельскохозяйственных данных является окклюзия растений.
Растения и сорняки имеют либо частичную, либо сильную окклюзию, что необходимо учитывать при генерации синтетических данных.
В противном случае модель недостаточно надежна, чтобы нормально работать с реальными полевыми изображениями. Многие из предложенных подходов были оценены на изображениях без окклюзии или только с низким уровнем окклюзии. Поэтому по-прежнему сложно оценить эффективность алгоритмов обнаружения растений на изображениях, где растения полностью закрыты, поскольку эти случаи близки к полевой ситуации.
Таким образом, цель этого исследования состояла в том, чтобы определить применимость региональной CNN для обнаружения однодольных / двудольных сорняков в полевых условиях и изображений с высокой степенью окклюзии, которые необходимы для оценки развития сорняков.
Чтобы достичь этой цели, были использованы две сети обнаружения объектов глубокого обучения, чтобы идентифицировать сорняки и распознавать их из существующих густых посевов на изображениях.
Также важно отметить, что в центре внимания этого исследования была разработка всей цепочки от записи на месте и создания смоделированных изображений, а также использование двух сетей обнаружения объектов с глубоким обучением, EfficientDet и YOLOv5, для обнаружения и распознавания сорняков в пределах изображения с высокой окклюзией.
Для разработки эффективного подхода к обнаружению сорняков на красных, зеленых и синих (RGB) изображениях две современные модели обнаружения объектов, EfficientDet (коэффициент 3) и YOLOv5m, были обучены на более чем 26 000 помеченных на месте изображения с классами однодольных/двудольных растений, полученные с более чем 200 различных полей в Дании.
Набор данных был собран с помощью высокоскоростной камеры (HVCAM), оснащенной ксеноновой кольцевой вспышкой, которая подавляет солнечный свет и минимизирует тени, что позволяет камере записывать изображения с горизонтальной скоростью более 50 км/ч.
Был разработан и использован новый алгоритм обработки изображений для создания синтетических изображений для тестирования производительности модели на некоторых изображениях со сложным перекрытием, которые были должным образом сгенерированы с использованием предложенного алгоритма.
Структура алгоритма представлена следующим образом.
К изображениям сорняков применен набор преобразований, таких как вращение, увеличение и уменьшение масштаба и методы размытия, которые подготовили их к следующему шагу.
Если случайно выбранный фон содержит несколько пикселей, принадлежащих кадрам, то предложенный алгоритм сегментации будет активен и найдет на изображении пиксели кадра.
Случайное число от 1 до 100 относится к количеству необходимых сорняков для каждого фонового изображения, которое будет выбрано, и в соответствии с выбранным числом будет выбран список сорняков из всех доступных изображений сорняков. Выбранное число представляло уровень окклюзии в сгенерированных синтетических изображениях. Чем больше число, тем тяжелее окклюзия в сгенерированных синтетических изображениях.
Разработанный алгоритм автоматической обработки изображений выбирает случайные координаты x и y для размещения изображения сорняков на случайно выбранном фоновом изображении.
Рассчитывается перекрытие между пикселями урожая и сорняка, и если перекрытие составляет менее 10 процентов от размера сорняка, координата будет утверждена, и выбранный сорняк вставится на фон, в противном случае область перекрытия сорняка будет устранена, а его граница в поле обновляется на основе оставшейся части сорняков, которая не перекрывается с пикселями обрезки.
Эти шаги повторяются до тех пор, пока все выбранные сорняки не будут правильно вставлены в фоновое изображение, и, наконец, будет сгенерировано синтетическое изображение.
Обе сети глубокого обучения были обучены на изображениях на месте, а затем оценены как на синтетических, так и на новых невидимых изображениях на месте, чтобы оценить их производительность.
Полученная средняя точность (AP) моделей EfficientDet и YOLOv5 на 6625 синтетических изображениях составила 64,27% и 63,23% соответственно для класса однодольных и 45,96% и 37,11% для класса двудольных.
Эти результаты подтвердили, что обе сети с глубоким обучением могут обнаруживать сорняки с высокой производительностью.
Тем не менее, важно было проверить надежность модели на изображениях in-situ, на которых имеется тяжелая окклюзия со сложным фоном. Поэтому, 1149 полевых изображений были записаны в 5 различных полях в Дании, а затем использованы для оценки надежности обеих предложенных моделей. На следующем этапе, запустив обе модели на 1149 изображениях in-situ, полученная средняя точность однодольных/двудольных для моделей EfficientDet и YOLOv5 составила 27,43%/42,91% и 30,70%/51,50% соответственно.
Исследование показывает, что архитектура YOLOv5 с глубоким обучением обеспечивает эффективный подход к обнаружению и распознаванию сорняков на изображениях в уличных условиях.
YOLOv5 показал лучшие результаты при обнаружении как однодольных, так и двудольных растений на изображениях in-situ.
Фото Нима Теймури, Расмус Нюхольм Йоргенсен, Оле Грин.
Эти результаты показали, что можно надежно использовать модель YOLOv5 в полевых условиях, поскольку ее производительность и возможности существенно не снизились, как в случае с EfficientDet».
По статье группы авторов (Нима Теймури, Расмус Нюхольм Йоргенсен, Оле Грин), опубликованной на портале www.mdpi.com.
Заглавное фото: pixabay.com.
