- Главная
- →
- Нейронные сети, искусственный интеллект
Нейронные сети: быстрый инференс на GPU с помощью TensorRT (демо) Нейронные сети, искусственный интеллект
- Исследователь и разработчик в областях машинного обучения, нейронных сетей, компьютерного зрения и обработки сигналов.
- Занимался задачами, связанными с медицинскими изображениями, распознаванием, обработкой изображений, 3D-анимацией.
- Время от времени читает вводные научно-популярные лекции по Deep Learning.
Тезисы
Современные нейронные сети базируются на высоконагруженных вычислениях. Для быстрого обучения и инференса (прямого распространения) важны как аппаратное обеспечение, так и программное. Современные фреймворки, используемые для построения и обучения нейронных сетей, могут жертвовать производительностью в пользу большей гибкости. Поэтому для внедрения обученной нейронной сети может потребоваться её оптимизация. В докладе будет продемонстрирована возможность быстрого инференса обученной модели на GPU с помощью библиотеки TensorRT.
План доклада:
- Краткое введение в свёрточные нейронные сети.
- Быстрый инференс с помощью TensorRT: описание библиотеки и её особенностей.
- Демонстрация построения и обучения нейронной сети на TensorFlow.
- Демонстрация конвертации обученной модели в TensorRT для последующего быстрого инференса.