«В последнее время ряд известных разработчиков систем автопилотирования таких как Tesla, Google и другие, объявил об усовершенствовании архитектуры нейронных сетей, используемых в своих решениях. Cognitive Pilot, на основе наработанного опыта работы, предложила собственный подход к совершенствованию архитектуры, который нам представляется более эффективным и который позволил в короткие сроки достичь значимых результатов», - говорит ведущий разработчик Cognitive Pilot Геннадий Савицкий.
В отличие от традиционных методов улучшения нейронных сетей, которые часто требуют сбора больших объемов данных, специалисты компании Cognitive Pilot применили инновационный подход, сосредоточившись на умном и рациональном отборе информации. В своем решении они использовали современные аналитические методы, такие как TSNE (t-distributed Stochastic Neighbor Embedding) и OOD (Out-of-Distribution Detection). Этот метод позволяет создавать сбалансированные обучающие выборки, исключая избыточность и достигая максимальной эффективности при минимальном количестве данных.
Применение современной многозадачной трансформерной архитектуры позволило компании добиться принципиально нового уровня результатов в области автопилотирования сельскохозяйственной техники.
Новая архитектура сети включает несколько выходов (голов), каждый из которых отвечает за решение различных задач, таких как определение границ поля, обнаружение препятствий, выявление зон с возможным или невозможным вождением и т. д. Ключевым преимуществом предложенного подхода стало достижение согласованности в процессе обучения сети, что в сочетании с правильной стратегией заполнения обучающей выборки обеспечило значительное улучшение качества распознавания по сравнению с обучением каждой задачи отдельно. Совместное обучение также позволило адаптировать задачи сети к новым функциональным сценариям, которые изначально не были предусмотрены в целевой постановке (эмерджентность). Взаимодействие между выходами способствовало более глубокому и качественному извлечению признаков и устойчивому обобщению, что свидетельствует о формировании новых системных свойств нейросети, таких как эмерджентность и синергия в процессе совместного обучения. Новая архитектура получила название CognitiveNet.
В результате новых характеристик сети стало возможным всесторонне анализировать окружающую среду и более чем в два раза увеличить количество распознаваемых объектов, включая технику, животных и птиц.
«Можно сказать, что мы достигли уровня распознавания объектов, который превышает возможности человека. То есть, если дать группе экспертов неограниченное время на анализ полевой сцены с входного сигнала камеры, то они смогут определить существенно меньше объектов, чем наша нейросеть, но самое главное, что нейросеть это сделает за доли секунды. Сейчас мы сможем распознать даже воробья, сидящего в пшенице или другой культуре в задачах автопилотирования сельхозтехники», комментирует Савицкий.
Новый детектор объектов, используемый в CognitiveNet, применяет передовые методы уточнения границ, что позволяет уменьшить ошибки локализации и повысить точность обнаружения. Благодаря более высокому уровню локализации объектов и улучшенной классификации, количество ошибок распознавания значительно сократилось, в некоторых случаях снижение составило более 10 раз. Обновленная структура сети теперь более точно определяет границы распознаваемых объектов и снижает вероятность неверного распознавания элементов, которые не являются объектами (например, фона или мелких деталей).
Инновационный подход к обучению также способствует передаче информации о расположении объектов между слоями модели, что улучшает предсказания без увеличения вычислительных затрат. Это, в свою очередь, существенно снизило требования к вычислительным ресурсам. В результате производительность системы возросла более чем на 40%.
«Усовершенствованная архитектура нейросети – это огромный шаг вперед. В CognitiveNet реализованы наши последние достижения в этой области. Они не только позволяют разработчикам экономить десятки человеко-лет при создании автопилотов и увеличивать производительность системы, главное, что они обеспечивают максимальный уровень безопасности и наивысшее качество работы техники, на которой работают наши ИИ-автопилоты. Мы очередной раз подтверждаем, что российские решения являются законодателями мод в этом важнейшем направлении мирового рынка высоких технологий», - говорит генеральный директор Cognitive Pilot Ольга Ускова.
Еще одно значительное преимущество новой архитектуры – это возможность самодиагностики и оценки надежности своих предсказаний, что особенно важно в системах автопилотирования, где критически необходимо осознавать уровень уверенности модели в каждом принимаемом решении. В тех случаях, когда сеть выдает предсказания с низким уровнем надежности, система может оперативно сигнализировать о необходимости дополнительной обработки или привлечения внешнего вмешательства.
«Такой подход выглядит более прозрачным и сбалансированным по сравнению с полностью сквозными (end-to-end) решениями, которые часто исключают использование программных алгоритмов. Это позволяет избежать проблем с интерпретируемостью решений и вносить необходимые коррективы для обеспечения надежности», – подчеркивает Савицкий.
Источник и фото: пресс-служба Cognitive Pilot.
