English

Создание информационных массивов данных дистанционного зондирования Земли

Заказчик

ПАО «Ростелеком»

Крупнейший в России провайдер цифровых услуг и решений.

Задача

Создать информационные массивы данных дистанционного зондирования Земли в рамках выполнения работ по установлению границ земель сельскохозяйственного назначения, сельскохозяйственных угодьев Приволжского федерального округа, Оренбургской области, Чувашской Республики и Республики Башкортостан.

Решение

Официальная постановка задачи звучит немного сухо, но основная суть сводиться к тому, что нужно было определить границы земельных участков, а также чем они засеяны. После чего, сформировать картографические слои, с использованием собранных данных и применением алгоритмов машинного обучения.

Вообще, работы такого рода ведутся уже довольно давно. И стоит сказать, что за годы исследований накопился большой объем исторических данных. Однако только сейчас, обладая полнотой технических средств, отрасль начинает использовать мощь машинного обучения, для автоматизации данных исследований.

Решение любой задачи машинного обучения всегда начинается с данных. И в рамках данного проекта, нам пришлось углубиться в те данные, что мы можем использовать. Так, например, помимо современных снимков, мы произвели оцифровку и векторизацию архивных данных начиная с 1984 года. По итогу получилось собрать довольно большой массив данных, состоящий из архивных записей о земельных участках, землеустроительной документации, а также разного рода пространственные данные — от картографических и геодезических карт и до аэрокосмические снимков с NDVI и многими другими слоями.

Полная обработка данных, позволила нам создать историю использования земель сельскохозяйственного назначения. В итоге, обладая большим массивом данных, мы смогли создать и обучить собственную нейросеть, которая определяет границ пахотных земель, а также классифицирует тип сельскохозяйственной культуры. Последующий анализ космических снимков позволил нам создать реестр земель, рекомендуемых для включения в состав земель сельскохозяйственного назначения. Отдельно хочется осветить вопрос актуальности подобных исследовательских работ. На сколько в принципе точна обученная нами нейросетевая модель? Для проверки точности в работе использовался довольно простой, и в тоже время элегантный метод — построение матрицы ошибок. С помощью данной матрицы довольно легко оценить точность обученной модели. В нашем случае, согласно техническому заданию заказчика, достаточно было получить уровень ошибок, не превышающий 5%.

Актуализация информации о землях сельскохозяйственного назначения имеет очень большую важность для всей сельскохозяйственной отрасли. Полученные в рамках исследовательских работ данные поступают в Единую федеральную информационную систему о землях сельскохозяйственного назначения (ЕФИС ЗСН). Данная система в дальнейшем используется органами государственной власти, а также налоговыми органами регионов. Также, благодаря актуальной информации, происходит более интенсивное развитие сельскохозяйственной отрасли в целом.