- Главная
- →
- Нейронные сети, искусственный интеллект
Распознавание облаков и теней на спутниковых изображениях с использованием глубокого обучения Нейронные сети, искусственный интеллект
Основатель и руководитель компании "Грамант", специализирующейся на разработке высоконагруженных Интернет-систем. В основном занимается запуском новых проектов, аналитикой и маркетингом. Является со-основателем и тех. диром agritech стартапа Fertyle, автором нескольких патентов в области роботизации сельского хозяйства. До этого был научным сотрудником, финансовым разработчиком, главным архитектором и руководителем IT-филиала известной японской Интернет-компании. Участвовал в ее продаже Yahoo! и выводе на IPO.
Тезисы
Спутниковые изображения Landsat-8 являются одним из наиболее востребованных инструментов мониторинга и исследования земной поверхности. Одной из главных проблем использования этих изображений является зашумленность их облаками и тенями от облаков. На начальном этапе обработки необходимо "отбраковать" зашумленные части сцен или сцены целиком. Традиционные алгоритмы, такие как Fmask неплохо работают, однако они требуют достаточно сложной и тонкой настройки параметров и порогов, зависят от "проблемной" частотной полосы TIRS (Termal Infra Red), а также плохо справляются с тонкими облаками верхних ярусов.
Мы разработали алгоритм распознавания облаков и теней, основанный на сверточной нейронной сети и позволяющий надежно классифицировать облака, тонкие облака, тени и чистые пиксели. Алгоритм работает без использования TIR-диапазона.
Основная идея алгоритма состоит в использовании как локального, так и глобального контекста для по-пиксельной классификации. Надо сказать, что львиная доля работ, связанных с классификацией изображений, в т.ч. известные соревнования ImageNet, занимается поиском объектов на изображении, а не пиксельной классификацией. Пиксельная классификация гораздо менее проработана и там еще есть куда двигаться.
Сеть была обучена на тестовом наборе из 12 размеченных сцен сельскохозяйственных районов и показала точность 95%, что на 5% точнее Fmask. В процессе разработки архитектуры и обучения нейронной сети мы открыли для себя большое число полезных лайфхаков, которыми поделимся с аудиторией.