Профессиональная конференция разработчиков высоконагруженных систем

Москва, СКОЛКОВО,
7 и 8 ноября

Конференция прошла в этом году уже в десятый раз и собрала 2500 участников. Мероприятие направлено на обмен знаниями о технологиях, позволяющих одновременно обслуживать многие тысячи и миллионы пользователей.

Высокопроизводительный инференс глубоких сетей на GPU с помощью TensorRT

Нейронные сети

Доклад принят в Программу конференции

Максим Милаков

NVIDIA

Инженер по развитию технологий в NVIDIA, энтузиаст в области глубокого обучения.

Тезисы

Производительность инференса - одна из самых серьезных проблем при внедрении DL приложений, так как она определяет, какое впечатление от сервиса останется у конечного пользователя, а также какова будет цена внедрения этого продукта. Таким образом, для инференса важно быть высокопроизводительным и энергоэффективным. TensorRT автоматически оптимизирует обученную нейронную сеть для максимальной производительности, обеспечивая существенное ускорение по сравнению с обычными часто используемыми фреймворками.

Из презентации вы узнаете, какие оптимизации применяются в TensorRT, как его использовать и увидите, насколько он быстр в избранных задачах.

API

Профилирование

Масштабирование с нуля

Профессиональная конференция разработчиков высоконагруженных систем

Высокопроизводительный инференс глубоких сетей на GPU с помощью TensorRT Нейронные сети

Тезисы

Другие доклады секции Нейронные сети

Мы используем файлы cookie

Высокопроизводительный инференс глубоких сетей на GPU с помощью TensorRT
Нейронные сети

Другие доклады секции
Нейронные сети