Базы данных на GPU – архитектура, производительность и перспективы использования Базы данных и системы хранения
Около двух лет занимается разработкой low latency-приложения для оценки кредитных рисков в Deutsche Bank на Java. До этого около 3 лет занимался разработкой системы полнотекстового поиска для 1С на C++, еще раньше занимался разработкой учетных систем для производственных организаций.
Профессиональные интересы: высокопроизводительные, высоконагруженные системы.
Хобби: фитнес, электрогитара, эндуро, сноуборд.
В последние годы появляется все больше новых систем хранения данных, например, NoSQL, колоночные или графовые базы данных, InMemory и другие решения. Все они направлены на решение определенного класса задач, связанных с отказоустойчивостью, распределенной обработкой данных и/или производительностью. И в мире систем хранения и обработки данных появился еще один тип баз данных, который пытается повысить производительность обработки аналитических тяжелых запросов за счет использования GPU.
В своем докладе я расскажу про то, как устроены такие базы, как выполняются классические алгоритмы на GPU, в каких случаях есть смысл их использовать. В частности, в докладе будут освещены темы:
- принцип работы GPU;
- алгоритмы обработки данных на GPU и сравнение производительности с CPU;
- как GPU может помочь базам данных ускорить выполнение аналитических запросов;
- примеры реализаций баз данных на GPU;
- сравнение производительности Clickhouse и OmniSci;
- OmniSci и машинное обучение;
- отказоустойчивость, нагрузка, распределенная обработка данных;
- критерии выбора решений на GPU;
- где и как попробовать.