Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Как мы решали задачу идентификации по fingerprint или Apache Flink в условиях повышенного потребления ресурсов

BigData и инфраструктура машинного обучения (data engineering)

Java
ETL
Оптимизация
Рекомендации / ML
Обработка данных

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Докладчик подробно разберёт, в каком состоянии сегодня находится тема цифрового отпечатка (fingerprint) в задачах разработки и практического использования. Рекомендуем доклад всем, кто интересуется жизненным циклом идентификации в больших системах.

Целевая аудитория

Разработчики, инженеры данных, архитекторы, техлиды, которые занимаются потоковой обработкой данных

Тезисы

Одним из возможных решением задачи идентификации клиента является использование технологии fingerprint. Когда наша команда впервые столкнулась с такой задачей, мы взялись решать ее в real-time режиме с помощью таких технологий как Java, Apache Flink, Aerospike, ONNX. Для этого мы обучили нейронную сеть и внедрили ее в пайплайн обработки клиентского трафика.

При выводе в прод мы столкнулись со множеством проблем: не хватало ресурсов кластера (запуск на CPU), огромное количество запросов на идентификацию, а также кластер имел тенденцию разваливаться. В докладе расскажу как мы исследовали эти проблемы, что смогли решить и к каким выводам пришли.

Лид Java-разработчиков в MTS Digital. Занимается задачами real-time обработки данных

МТС Digital

МТС Digital — это IT-компания внутри крупнейшего телеком-оператора. У нас более 5000 IT-специалистов, есть startup hub и 12 профессиональных гильдий. В МТС Digital разные направления: от обработки больших данных, искусственного интеллекта и облачных сервисов до телемедицины и киберспорта, потому что мы создаем экосистему цифровых сервисов. https://mts-digital.ru.

Видео

Другие доклады секции

BigData и инфраструктура машинного обучения (data engineering)