Highload++ 2017 завершён!

Профессиональная конференция разработчиков высоконагруженных систем

СКОЛКОВО, Москва 7 и 8 ноября

11-я ежегодная конференция для разработчиков highload-систем, которая соберет   2 700 участников из разных регионов России и мира. Мероприятие направлено на обмен знаниями о технологиях, позволяющих одновременно обслуживать многие тысячи и миллионы пользователей.

Программа охватывает такие аспекты веб-разработок, как архитектуры крупных проектов, базы данных и системы хранения, системное администрирование, нагрузочное тестирование, эксплуатация крупных проектов и другие направления, связанные с высоконагруженными системами.

  • Главная
  • Нейронные сети, искусственный интеллект

Нейронные сети: быстрый инференс на GPU с помощью TensorRT (демо)
Нейронные сети, искусственный интеллект

Доклад принят в Программу конференции
NVIDIA

- Исследователь и разработчик в областях машинного обучения, нейронных сетей, компьютерного зрения и обработки сигналов.
- Занимался задачами, связанными с медицинскими изображениями, распознаванием, обработкой изображений, 3D-анимацией.
- Время от времени читает вводные научно-популярные лекции по Deep Learning.

Тезисы

Современные нейронные сети базируются на высоконагруженных вычислениях. Для быстрого обучения и инференса (прямого распространения) важны как аппаратное обеспечение, так и программное. Современные фреймворки, используемые для построения и обучения нейронных сетей, могут жертвовать производительностью в пользу большей гибкости. Поэтому для внедрения обученной нейронной сети может потребоваться её оптимизация. В докладе будет продемонстрирована возможность быстрого инференса обученной модели на GPU с помощью библиотеки TensorRT.

План доклада:
- Краткое введение в свёрточные нейронные сети.
- Быстрый инференс с помощью TensorRT: описание библиотеки и её особенностей.
- Демонстрация построения и обучения нейронной сети на TensorFlow.
- Демонстрация конвертации обученной модели в TensorRT для последующего быстрого инференса.

Фреймворки
,
C/C++
,
Python
,
Оптимизация производительности
,
Другое
,
Machine Learning

Другие доклады секции
Нейронные сети, искусственный интеллект

Rambler's Top100