Полная прозрачность, или Как избежать серой земли

27 ноября 2019, 07:21 8351
Валерий Яковенко

Современные технологии позволяют держать руку на пульсе вопросов того, как именно используется земля. Оцифровка всего земельного банка — это реальные и существующие технологии, которые уже не один год работают на территории Украины.

Впервые в этом направлении начали работать в Институте космических исследований НАН Украины, потом — в компаниях ЕОS и Drone.ua появились свои сервисы в направлении работ по автоматической классификации полей.

Реализация технологий обеспечивается благодаря обработке данных спутников и работе нейросетей.

Спутниковые данные получаются из открытых источников, проводится регулярная съемка всей территории, которую затем анализирует нейросеть. Она определяет, как менялись цвета на снимке, исследует состав кадра и другие характеристики поля за заданный промежуток времени и с точностью вычисляет реальные размеры поля, а также дает информацию о том, что в этом году там засеяли и с какой плотностью. Это возможно благодаря тому, что каждая культура обладает своим паттерном прироста биомассы, периодами цветения или спектральными характеристиками.

На выходе при помощи данной технологии можно точно сказать, какое количество полей, какой площади и какой культурой они засеяны, в различные периоды времени, от ретроспективного анализа до прогнозов в середине вегетационного сезона.

Для обучения нейросетей используется выборка физически подтвержденных полей, на которых выполнялись полеты дронами, или визуальное определение культуры сотрудниками полевых команд DroneUA специально для данного проекта.

В результате создаются актуальные карты посевов с детализацией от 10 м/пиксель с координатной привязкой и автоматически определенной культурой посева. Точность определения культур превышает 95%.

Статистическая информация предоставляется в разрезе районов, областей и в дальнейшем — на уровне страны.

Государственные структуры интересуются этим проектом постоянно, и мы фактически каждую неделю ведем переговоры с чиновниками о возможности использования данных ресурсов. Этот интерес обусловлен тем, что технологии весьма простые и статистически точные.

Технологии по автоматической классификации земельного банка можно разделить на два больших сценария. Первый — это классификация только с использованием спутниковых технологий и баз обучения нейросетей, основанных на данных севооборота сельскохозяйственных предприятий. Результат в данном случае получается весьма дешевый. Плюсы этого варианта — без физического присутствия в поле мы получаем результат с весьма низкой точностью. Ведь статистическая информация, которую мы загружаем в систему, точно также может содержать ошибку, и данные получаются исковерканные.

Другое направление услуг и сервисов по автоматической классификации посевных площадей состоит из возможности строить базу знаний для нейросети, исходя из физического присутствия на поле. Для этого необходимо собрать данные тысяч визитов, тысяч полей, на которых вы поприсутствовали лично, и только такой подход дает максимальную точность.

Когда вы предоставляете данные отчета, и они используются чиновниками для принятия каких-то выводов и решений, нужно убедится, что эти данные точны. Ведь ошибка может нанести вред.

Мы нашли выход. Работая в проектах для государственной налоговой службы, мы использовали физические визиты наших сотрудников, операторов дронов и пилотных групп на полях как акты осмотра. И вместе с формированием огромной базы для обучения нейросетей мы получали перечень определенных валидационных точек, которые могли быть использованы как факт визита и подтверждение фактажа нарушения севооборота или нарушений использования земельного банка. По нарушениям составлялся акт, который автоматически подтягивал информацию о визите сотрудника на поле с фото и видеоматериалами, которые свидетельствовали о нарушении. Для этого мы командировали сотрудников в исследуемые регионы, которые за несколько дней собирали достаточное количество данных. Сразу стоит отметить, что учитывая специфику нашего сотрудничества с фермерами, мы не использовали для обучения данные наших работ по другим проектам, которые не были связаны с государственной налоговой службой.

Все  это является интересным процессом, который позволяет данные спутникового мониторинга с использованием нейросетей превратить в статистический отчет, позволяющий отслеживать нарушения по использованию земельного банка.

Но эту работу нельзя выполнить только раз. Из сезона в сезон необходимо выполнять калибровку баз знаний для нейросетей, это необходимо делать повторно на разных территориях Украины. Для каждого сезона необходимо обновление привязочного датасета, который каждый раз нужно физически собирать. 

Независимо от того, кто создает первичное наполнение базы, всегда будет затратная часть, которую необходимо компенсировать: речь идет о ежегодных инвестициях в знаниевую модель нейросетей. Если упустить момент и не собирать данные для пополнения знаний и баз, на которых обучается нейросеть, можно в какой-то степени даже потерять результаты достижения предыдущих сезонов.

Важный момент — это работа, которая задействует большое количество игроков на рынке и вряд ли может быть выполнена одним человеком или финансироваться одной компанией. Для реализации проекта, о котором говорил Тимофей Милованов, потребуется очень большое количество ресурсов, и думаю, что абсолютно все участники рынка, которые представляют такую информацию и технологии, будут востребованы и вклад каждого будет оценен.

Валерий Яковенко, сооснователь компании DroneUA

Мнение автора может не совпадать с мнением редакции. Ответственность за цитаты, факты и цифры, приведенные в тексте, несет автор.