Портируем ML на RISC-V: как не потерять производительность
Доклад принят в программу конференции
Целевая аудитория
Тезисы
Ни для кого не секрет, что современные архитектурные решения для ML, помимо мощностей ЦПУ, задействуют ресурсы тензорных или графических ускорителей. В итоге производительность упирается в пропускную способность шины, и не всегда перенос вычислений на ускоритель стоит свеч. Обсудим, каким образом эта проблема может быть решена в процессорах на базе архитектуры RISC-V и почему многие эксперты считают ее будущим для ML-приложений.
Но, чтобы будущее наступило, необходимы не только процессоры, но и работающая на них программная экосистема. Покажем, как удалось не только портировать на RISC-V важную составляющую ML-фреймворков — высокопроизводительную open source-библиотеку линейной алгебры Eigen, но и «малой кровью» оптимизировать ее под векторное расширение RISC-V RVV.
Разработчик высокопроизводительных математических библиотек на C/C++ и asm, в т.ч. с использованием технологий DPC++, OpenMP, CUDA. В Intel разрабатывала реализации генераторов случайных чисел под GPU на DPC++ для проекта oneDPL https://github.com/oneapi-src/oneDPL. В YADRO занимается оптимизацией библиотек линейной алгебры под архитектуру RISC-V.