Как ускорить обучение нейросетей на 45%?
Привет, друзья!
Сегодня для вас — подборка свежих материалов на тему искусственного интеллекта. Если вас интересует, что происходит с нейросетями в России и как решаются вопросы нехватки ресурсов, загляните в интервью с Сергеем Марковым.
Он поделился своим мнением о будущем Data Science и правилах использования ИИ, а также рассказал о том, как развивается эта область у нас на рынке.
А если вы хотите узнать, как мультимодальные модели изменяют подходы к поиску изображений, Дмитрий Огурцов из Okko расскажет, как обучать нейросети для более точного поиска картинок через текстовые запросы. Эти методы уже активно применяются и дают отличные результаты.
На предстоящей конференции Highload++ 2024 будем горячо обсуждать темы, связанные с нейронными сетями и искусственным интеллектом. Углубимся в самые актуальные технологии и узнаем, как оптимизировать обучение LLM и увеличить утилизацию GPU более чем на 45%. Приходите обменяться опытом оптимизации претрейнов и использования 3D-4D параллелизма для повышения скорости обучения.
Если вы ещё не успели приобрести билеты на Highload++ 2024, напоминаем, что с 1 октября цены на билеты станут выше. Сейчас — самое время присоединиться к крупнейшей конференции для разработчиков высоконагруженных систем, где вас ждут эксперты мирового уровня, новые знания и полезные контакты.
Забронировать билет
Доклады HighLoad++ 2024
Михаил Хрущев(Яндекс) расскажет, как ускорить обучение LLM на 45%, используя оптимизации памяти и параллелизм. Претрейны стали быстрее в 1,5 раза, а сценарии Alignment/DPO — в 5-10 раз! Узнайте все секреты ускорения на его докладе.
Владимир Морозов (Авито) представит эффективные методы модерации изображений: от применения блюра до использования inpainting-технологий, таких как LaMa и LDM. Как сократить ручные проверки в 10 раз и при этом сохранить качество контента?
Данила Федюкин (X5 Digital) расскажет, как отказаться от подрядчиков, внедрить свои рекомендации и при этом заработать больше. Этот доклад полезен всем, кто ищет пути оптимизации работы с ML без высоких затрат на инфраструктуру.
С Олегом Гринчуком (VisionLabs) обсудим специализированные и мультимодальные модели Face Liveness для защиты от идентификационного фрода. Как эта технология применяется в банковской сфере и в московском транспорте?