Нейросетевые технологии в компьютерном зрении за последние 10 лет достигли невероятных высот. Качество распознавания образов в помощью систем deep learning достигло уровня, не уступающего человеческому зрению, а зачастую и превосходящего его.
В данном докладе мы рассмотрим основные аспекты практического применения алгоритмов глубинных нейронных сетей различных архитектур в таких областях как распознавание образов, распознавание лиц, обработка изображений и видео, общение на естественном языке.
Также мы расскажем о том, какие архитектуры применяются в каких областях и как они используются. Наш доклад будет состоять из трех частей, каждую из которых мы посвятим одной из наиболее часто используемых архитектур нейронных сетей в машинном обучении.
В первой части мы рассмотрим наиболее популярный вид нейронных сетей: нейронные сети для классификации (CNN, DBN). Такие сети применяются, в основном, в компьютерном зрении: для классификации изображений, лиц, в медицине и радиологии. Мы рассмотрим, какие именно задачи решаются с помощью нейронных сетей свертки: идентификация объектов (object detection), семантическая сегментация (semantic segmentation), распознавание лиц (face recognition), распознавание частей тела человека (human body parts recognition), семантическое определение границ (semantic boundary detection), выделение объектов внимания (saliency estimation), выделение нормалей к поверхности (surface normal estimation). Рассмотрим пример сети для распознавания лиц на примере FindFace и расскажем о способах определения уровня бедности населения с помощью нейронных сетей.
Рассмотрим другой класс нейронных сетей - рекуррентные нейронные сети. Рассмотрим применение RNN для распознавания и генерации естественного языка, LSTM. В качестве примера рассмотрим RNN для распознавания видео на примере нейронных сетей, разработанных командой Монреаля для распознавания эмоций (EmoNets) и сетей LSTM для анализа высказываний (sentiment analysis).
В части №3 мы поговорим об обучении с подкреплением (reinforcement learning), глубинном варианте обучения с подкреплением (deep Q-network, DQN) компании DeepMind.
В конце приведем примеры нестандартных нейросетевых решений для творчества (Призма, Артисто, DeepDream).