Кое-что о вероятностных структурах данных Бэкенд, теория программирования
Доклад принят в программу конференции
Тезисы
Вероятностные структуры данных позволяют значительно экономить на памяти для таких запросов, как поиск количества уникальных объектов, вхождение объекта, подсчет конкретного объекта. При этом используется на 1-2 порядка меньше памяти (в некоторых задачах вообще константный объем), чем на хранение исходных данных. Как недостаток, мы иногда контролируемо ошибаемся, например, с ошибкой 10^{-9}.
Рассмотрим классические HyperLogLog, BloomFilter, CountMinSketch, как это устроено внутри и математику, использование для простейшего KV-хранилища, хранения "лайков", количества просмотров и уникальных, ротацию всего этого во времени.
Другие доклады секции Бэкенд, теория программирования
Новый граф Одноклассников
Антон Иванов
Одноклассники
Алгоритмы быстрой обработки HTTP-строк
Александр Крижановский
Tempesta Technologies
Хэши в S3: как мы ускоряли прокачку трафика с 30 до 300 Мб/с с одного ядра
Олег Кошовец
Mail.ru Cloud Solutions
NJS в production
Василий Сошников
Quantil Inc.
Learnings from migrating a high load/low latency production service from JDK 8 to JDK 11
Yishai Galatzer
Amazon
Все домены мира в RAM процесса
Евгений Буевич
RU-CENTER