Портируем ML на RISC-V: как не потерять производительность

Аппаратное обеспечение

C/C++
Архитектурные паттерны
Оптимизация производительности
Разработка библиотек, включая open source библиотеки
Алгоритмы и их сравнение
Архитектуры / другое
Аппаратное обеспечение
Оптимизация
ML
Расширение кругозора

Доклад принят в программу конференции

Целевая аудитория

Люди, которым интересны AI/ML, низкоуровневые оптимизации, новые архитектуры и высокопроизводительные вычисления

Тезисы

Ни для кого не секрет, что современные архитектурные решения для ML, помимо мощностей ЦПУ, задействуют ресурсы тензорных или графических ускорителей. В итоге производительность упирается в пропускную способность шины, и не всегда перенос вычислений на ускоритель стоит свеч. Обсудим, каким образом эта проблема может быть решена в процессорах на базе архитектуры RISC-V и почему многие эксперты считают ее будущим для ML-приложений.
Но, чтобы будущее наступило, необходимы не только процессоры, но и работающая на них программная экосистема. Покажем, как удалось не только портировать на RISC-V важную составляющую ML-фреймворков — высокопроизводительную open source-библиотеку линейной алгебры Eigen, но и «малой кровью» оптимизировать ее под векторное расширение RISC-V RVV.

Разработчик высокопроизводительных математических библиотек на C/C++ и asm, в т.ч. с использованием технологий DPC++, OpenMP, CUDA. В Intel разрабатывала реализации генераторов случайных чисел под GPU на DPC++ для проекта oneDPL https://github.com/oneapi-src/oneDPL. В YADRO занимается оптимизацией библиотек линейной алгебры под архитектуру RISC-V.

Видео