Как выкатить в highload production сервис рекомендаций с BERT-like-моделью

BigData и машинное обучение

ML. рекомендации

Доклад принят в программу конференции

Целевая аудитория

Доклад будет полезен тем, кто собирается разрабатывать сервис машинного обучения в высоконагруженной среде.

Тезисы

В Работа.ру мы занимаемся разработкой сервисов на основе машинного обучения для улучшения пользовательского опыта при поиске работы. Недавно мы внедрили сервис рекомендаций, один из центральных сервисов нашей платформы.

В своем докладе я расскажу об опыте обучения и дистилляции мультиязычной, легковесной модели на основе архитектуры Transformer, адаптированной для HR-домена. О вариантах сервисов на базе этой модели и о нашем опыте развития архитектурных решений в зависимости от нагрузки.

После доклада у слушателя появится представление:
* о процессе обучения и дистилляции BERT-like-модели,
* о нескольких вариантах архитектуры сервисов на её основе,
* о производительности, которую можно ожидать от этих вариантов.

Марк Паненко

Работа.ру

TeamLead в Работа.ру.
Руководит командой, которая занимается задачами машинного обучения в областях NLP и RecSys. Ранее разрабатывал сервисы машинного обучения для крупных международных компаний в должности Senior ML Engineer в компании ClearScale(USA) и Neurons Lab (UK).

Работа.ру

Работа.ру — один из ведущих российских сервисов для поиска работы и сотрудников. В последний год круто выросла команда и экспертиза.

Видео

Другие доклады секции

BigData и машинное обучение