Заказчик
![](https://mst-company.ru/images/about/clients/rt.jpg)
ПАО «Ростелеком»
Крупнейший в России провайдер цифровых услуг и решений.
Задача
Создать информационные массивы данных дистанционного зондирования Земли в рамках выполнения работ по установлению границ земель сельскохозяйственного назначения, сельскохозяйственных угодьев Приволжского федерального округа, Оренбургской области, Чувашской Республики и Республики Башкортостан.
Решение
Официальная постановка задачи звучит немного сухо, но основная суть сводиться к тому, что нужно было определить границы земельных участков, а также чем они засеяны. После чего, сформировать картографические слои, с использованием собранных данных и применением алгоритмов машинного обучения.
Вообще, работы такого рода ведутся уже довольно давно. И стоит сказать, что за годы исследований накопился большой объем исторических данных. Однако только сейчас, обладая полнотой технических средств, отрасль начинает использовать мощь машинного обучения, для автоматизации данных исследований.
![](https://mst-company.ru/images/projects/geo/geo_02.jpg)
Решение любой задачи машинного обучения всегда начинается с данных. И в рамках данного проекта, нам пришлось углубиться в те данные, что мы можем использовать. Так, например, помимо современных снимков, мы произвели оцифровку и векторизацию архивных данных начиная с 1984 года. По итогу получилось собрать довольно большой массив данных, состоящий из архивных записей о земельных участках, землеустроительной документации, а также разного рода пространственные данные — от картографических и геодезических карт и до аэрокосмические снимков с NDVI и многими другими слоями.
Полная обработка данных, позволила нам создать историю использования земель сельскохозяйственного назначения. В итоге, обладая большим массивом данных, мы смогли создать и обучить собственную нейросеть, которая определяет границ пахотных земель, а также классифицирует тип сельскохозяйственной культуры. Последующий анализ космических снимков позволил нам создать реестр земель, рекомендуемых для включения в состав земель сельскохозяйственного назначения. Отдельно хочется осветить вопрос актуальности подобных исследовательских работ. На сколько в принципе точна обученная нами нейросетевая модель? Для проверки точности в работе использовался довольно простой, и в тоже время элегантный метод — построение матрицы ошибок. С помощью данной матрицы довольно легко оценить точность обученной модели. В нашем случае, согласно техническому заданию заказчика, достаточно было получить уровень ошибок, не превышающий 5%.
Актуализация информации о землях сельскохозяйственного назначения имеет очень большую важность для всей сельскохозяйственной отрасли. Полученные в рамках исследовательских работ данные поступают в Единую федеральную информационную систему о землях сельскохозяйственного назначения (ЕФИС ЗСН). Данная система в дальнейшем используется органами государственной власти, а также налоговыми органами регионов. Также, благодаря актуальной информации, происходит более интенсивное развитие сельскохозяйственной отрасли в целом.