Учёные из Сколтеха разработали подход для агрегации и картирования данных о качестве воды, почвы или воздуха для сельскохозяйственных, промышленных и природоохранных целей. Предложенный алгоритм принимает на вход разрозненные измерения параметров среды — уровней загрязняющих веществ, содержания микроорганизмов и т. д. — в разных точках заданного региона, прогнозирует значения этих параметров на не охваченных измерениями участках и отображает их в виде тепловой карты.
Решение также на основе данных из природоохранных стандартов выводит единую метрику качества среды и генерирует по ней карту, которая вбирает в себя сразу все параметры. Исследование опубликовано в Scientific Reports.
«Люди разрушают и загрязняют окружающую среду — почву, воду, воздух. Поэтому нужны эффективные способы оценивать и отслеживать её состояние, чтобы охранять природные ресурсы и оптимально их использовать», — объясняет один из авторов исследования, Полина Трегубова из Сколтеха. Если бы можно было в каждой точке некоторой области взять пробы воды, например, и проанализировать их по каждому параметру, получилась бы идеальная карта, но так, очевидно, не бывает.
«Вместо этого мы заполняем пробелы интерполяцией, то есть программа достраивает недостающие значения, пытаясь „угадать“ их на основании имеющихся данных из окружающих областей», — добавляет первый автор статьи, аспирант Сколтеха Артём Никитин. Путём интерполяции данных алгоритм сначала строит отдельную карту региона на каждый параметр: карту кислотности воды, карту содержания пестицидов и т. д. Каждый «пиксель» на карте — участок в 100 квадратных метров.
На этом работа алгоритма не заканчивается. После того как программа предсказала и визуализировала непрерывное изменение каждого параметра по отдельности, она использует операцию под кодовым названием «хитроумная агрегация данных» для синтеза единой метрики — индекса качества воды (почвы, воздуха и т. д.). По нему строится общая карта качества.
"Процедура агрегации отталкивается от санитарных норм и прочих стандартов качества, которые нужно подать на вход алгоритма. В этой статье использовались нормативные документы по воде, но подобные отраслевые или государственные стандарты по сельхозпочвам и любым другим средам тоже можно использовать, — поясняют учёные. — Прелесть этого решения в его гибкости: его можно масштабировать на любой регион, по которому доступны данные измерений, и любую среду, для которой есть нормативы у ВОЗ, корпораций или на национальном уровне».