Highload++ 2017 завершён!

Профессиональная конференция разработчиков высоконагруженных систем

СКОЛКОВО, Москва 7 и 8 ноября

11-я ежегодная конференция для разработчиков highload-систем, которая соберет   2 700 участников из разных регионов России и мира. Мероприятие направлено на обмен знаниями о технологиях, позволяющих одновременно обслуживать многие тысячи и миллионы пользователей.

Программа охватывает такие аспекты веб-разработок, как архитектуры крупных проектов, базы данных и системы хранения, системное администрирование, нагрузочное тестирование, эксплуатация крупных проектов и другие направления, связанные с высоконагруженными системами.

Производительность GIST и GIN индексов в PostgreSQL
Основная секция

Доклад принят в Программу конференции
VK — это более 200 технологичных проектов, больше 11 000 сотрудников и безграничные возможности проявить себя. Компания создает современные и быстрые интернет-сервисы, доступные каждому.

Тезисы

При построении современных информационных систем приходится решать разнообразные технологические задачи, связанные с хранением, доступом и поиском информации. Учитывая современные требования к производительности, надежности и шкалированию таких систем, такие задачи требуют использования достаточно сложных алгоритмов и специализированных структур данных (abstract data type, ADT).

Эффективный доступ к данным является одной из важнейшей задачей базы данных. Мы рассматриваем большие базы данных, которые не помещаются в оперативную память. Для таких БД эффективность доступа к данным определяется, в основном, количеством обращений к диску, поэтому основной задачей СУБД является минимизация этих обращений. Обычно, это достигается использованием индекса, который представляет собой вспомогательную структуру данных, предназначенную для ускорения получения данных удовлетворяющих определенным поисковым критериям. Индекс позволяет уменьшить количество дисковых операций необходимых для считывания данных с диска. Обычно, индекс представляет собой файл на диске, и, если этот файл становится очень большим, то может потребоваться дополнительный индекс для ускорения работы самого индекса. Методами доступа (access methods,AM), обычно, называют организацию (структуру) индексного файла и методы работы с ней. В традиционных реляционных СУБД для работы с одномерными данными, такими как строки, цифры, используются B+-tree и хэш, для которых разработаны очень эффективные алгоритмы работы. Однако, современные приложения, такие как ГИС (GIS), мультимедийные системы, CAD, цифровые библиотеки, которые по-сути используют многомерные данные, требуют других, более эффективных AM.

Для эффективной работы с такими многомерными данными PostgreSQL предлагает два типа индекса: GiST (Generalized Search Tree) и GIN (Generalized Inverted Index).

GiST был предложен Hellerstein et al. [HNP95] как обобщение нескольких классов индексов (такие как B-Tree, R-Tree, Similarity Tree, RD-Tree) и позволяет создавать индексы на базе произвольной метрики типа данных. Для использования GiST разработчик должен создать метрику и функции-адаптеры, используя API. Как классический индекс, в котором храниться одна и только одна пара ключ-ссылка, индексы GiST имеют хорошею производительность при вставке нового ключа, но производительность при поиске может сильно зависеть от метрики проиндексированного типа данных и собственно типа поискового запроса.

GIN представляет собой обратный индекс, в которов храняться ключи и список ссылок на значения, в которых ключи встречаются. Обратный индекс получил широкое распространение для полнотекстовго поиска. Но PostgreSQL предлагает некоторое обобщение обратного индекса, не ограничиваясь только текстом. Как и для использования индексов GiST, для использования индексов GIN разработчик должен создать несколько функций-адаптеров, в основном, выделяющие ключи из индексируемого или поискового значения. GIN показывает хорошую прозводительность при поиске данных мало завися от типа поискового запроса. Производительность при вставке сильно зависит от количества ключей в индексируемом значении - для каждого ключа требуется отдельная вставка в индекс.

В докладе представлены сравнение производительности и потребного дискового пространства для GIN и GiST индексов на примере полнотекстового поиска с использованием модуля раширения tsearch2, а также практические советы по их использованию в высоконагруженных приложениях.

Другие доклады секции
Основная секция

Garage Eight — международная продуктовая IT-компания. Умеют быстро и гибко адаптироваться к любым вызовам и ценят свободу своей команды.
VK — это более 200 технологичных проектов, свыше 11 000 сотрудников и более 20 лет опыта создания высоконагруженных интернет-сервисов. ВКонтакте, Одноклассники, VK Cloud, Дзен, Маруся, VK Play — это лишь часть продуктов VK, которыми ежедневно пользуются миллионы людей по всей стране.
Мы - разработчик Proto Observability Platform - первой российской full stack observability платформы, и сервис-провайдер c более 10 лет опытом выполнения проектов по цифровой трансформации, кибербезопасности, облачным вычислениям, разработке программных продуктов на основе стека современных технологий.
IT-компания и основной цифровой партнер торговых сетей и бизнесов X5 Group. Команда из более 3500 специалистов разрабатывает решения, которые помогают 325 тысячам сотрудников группы работать с максимальным технологическим комфортом, а миллионам покупателей быстро и удобно покупать свежие продукты.
SberDevices — это компания полного цикла. Мы создаем идеи, самостоятельно разрабатываем продукты, занимаемся прототипированием, конструированием, придумываем дизайн, программные решения, контролируем качество на фабриках и создаем инструменты для аппаратного тестирования. Перед SberDevices стоит амбициозная задача: сделать новейшие технологии максимально доступными в повседневной жизни, помочь им раскрыться и практически, и коммерчески.
Raft AI Labs — это подразделение компании Raft, специализирующееся на разработке и интеграции решений с использованием новейших AI-технологий. С помощью передовых технологий и инновационных подходов они преобразуют и оптимизируют бизнес-процессы, повышая их производительность и эффективность.
Гринатом – ИТ-компания в структуре Росатом с фокусом на разработке инновационных решений для современных бизнес-процессов в атомной отрасли и за ее пределами. Мы развиваем цифровую экосистему Росатома, создаем свое ПО и обеспечиваем атомную отрасль современными ИТ-решениями, услугами и сервисами.
Evocargo - логистический сервис на базе беспилотных грузовиков
Создают цифровой банк с лучшим пользовательским опытом, персонализацией продуктов и быстрым внедрением изменений. У них все быстро и просто: принимайте решения сами и смотрите, как на ваших глазах строчки кода превращаются в реальную пользу для клиентов.
На Авито каждый может найти что-то свое среди миллионов частных объявлений и предложений компаний. У нас десятки тысяч rps к бэкенду, терабайты картинок в хранилище и мощная система автоматизированной модерации на базе машинного обучения. Каждый месяц сервисом пользуется треть населения России.
Делают IТ для ритейла реального времени. IТ-продукты компании автоматизируют разные этапы цепочки создания ценности для клиента доставки: закупки, логистику, работу дарксторов, сборку и доставку заказа до двери, управление промокампаниями и остальные этапы большого процесса. Используют интеллектуальные системы прогнозирования, а все этапы выполнения заказа автоматизируют роботическими системами. Их IТ-решения помогают создавать один из самых быстрорастущих бизнесов в стране: в 2020 году их IТ-продукты помогали доставлять 1.6 миллиона заказов в месяц в 4 городах России, сейчас — более 10 миллионов заказов в месяц в более чем 60 городах.
«Нетология» — российская компания и образовательная онлайн-платформа, одна из ведущих российских компаний онлайн-образования.
ВКонтакте — крупнейшая социальная сеть в России и странах СНГ. Мы ставим перед собой масштабные вызовы и делаем технологии доступными для каждого пользователя. ВКонтакте помогает решать любые повседневные задачи — и даже больше!
Почтатех — дочерняя IТ-компания Почты России, созданная в 2016 году. Через их сервисы проходят петабайты данных, а в портфолио — цифровые продукты, которыми пользуются миллионы людей по всей стране. Портал и приложение Почты, логистические системы, софт для отделений — это лишь часть того, что они разрабатывают и поддерживают.
Гринатом – ИТ-компания в структуре Росатом с фокусом на разработке инновационных решений для современных бизнес-процессов в атомной отрасли и за ее пределами. Мы развиваем цифровую экосистему Росатома, создаем свое ПО и обеспечиваем атомную отрасль современными ИТ-решениями, услугами и сервисами.
Гринатом – ИТ-компания в структуре Росатом с фокусом на разработке инновационных решений для современных бизнес-процессов в атомной отрасли и за ее пределами. Мы развиваем цифровую экосистему Росатома, создаем свое ПО и обеспечиваем атомную отрасль современными ИТ-решениями, услугами и сервисами.
SberDevices — дочерняя компания Сбера, которая производит «умные» устройства. Это B2B- и B2C-девайсы для экосистемы с применением речевых технологий и виртуальным ассистентом на борту.
YADRO известна как разработчик и производитель всего, что можно увидеть в серверной и ЦОД: систем хранения данных, серверов, коммутаторов. С недавних пор компания также создает телеком-оборудование операторского класса. Go-разработчики заняты как в развитии СХД, так и в телеком-направлении.
VK — это более 200 технологичных проектов, больше 11 000 сотрудников и безграничные возможности проявить себя. Компания создает современные и быстрые интернет-сервисы, доступные каждому.
SberDevices — IT-компания полного цикла в экосистеме Сбера, R&D-центр экспертизы в области искусственного интеллекта: речевые технологии, понимание естественного языка, компьютерное зрение, лицевая и голосовая биометрия. Производит умные устройства — от лампочек до телевизоров. В портфолио SberDevices — ruGPT-3, ruDall-E, RuSBERT и другие масштабные ML-проекты, высоконагруженные системы и технологии обработки Big Data.
Garpix занимается созданием веб-сайтов и мобильных приложений, разработкой сложных информационных систем для бизнеса и госсектора, а также развитием своих собственных продуктов Garpix Load System, Garpix 3D Scan и Garpix Storage для оптимизации процессов складской логистики.
YCLIENTS — лидер среди SaaS-решений для автоматизации бизнеса в сфере услуг и онлайн-записи. Предоставляют мощную облачную ERP экосистему.
SberDevices — это компания полного цикла. Мы создаем идеи, самостоятельно разрабатываем продукты, занимаемся прототипированием, конструированием, придумываем дизайн, программные решения, контролируем качество на фабриках и создаем инструменты для аппаратного тестирования. Перед SberDevices стоит амбициозная задача: сделать новейшие технологии максимально доступными в повседневной жизни, помочь им раскрыться и практически, и коммерчески.
YCLIENTS — лидер среди SaaS-решений для автоматизации бизнеса в сфере услуг и онлайн-записи. Предоставляют мощную облачную ERP экосистему.
Яндекс — технологическая компания, которая создаёт инновационные продукты на основе машинного обучения и нейронных сетей. Команда талантливых математиков и программистов развивает самую популярную в России поисковую систему и более 85 пользовательских сервисов, которые помогают людям в повседневных заботах.
Postgres Professional — разработчик Postgres Pro, самой популярной российской системы управления базами данных. В команде Postgres Professional — 70% российских разработчиков PostgreSQL. Среди заказчиков Postgres Pro — крупнейшие российские компании из списка РБК-500, а также объекты КИИ.
Яндекс — технологическая компания, которая создает инновационные продукты на основе машинного обучения и нейронных сетей. Команда талантливых математиков и программистов развивает самую популярную в России поисковую систему и более 85 пользовательских сервисов, которые помогают людям в повседневных заботах.
«Рексофт» — одна из ведущих компаний по разработке программного обеспечения и информационных систем, обладающая значительным опытом по созданию проектов для таких сфер бизнеса, как телекоммуникации и мобильная связь, банки и финансы, IТ, медиа, гостиничный бизнес и туризм.
«Рексофт» — одна из ведущих компаний по разработке программного обеспечения и информационных систем, обладающая значительным опытом по созданию проектов для таких сфер бизнеса, как телекоммуникации и мобильная связь, банки и финансы, IТ, медиа, гостиничный бизнес и туризм.
Команда Тинькофф — это разработчики, тестировщики, SRE-инженеры, архитекторы, аналитики, продакт-менеджеры, дизайнеры и другие специалисты. Вместе они создают финтех-продукты, которыми пользуются более 38 миллионов клиентов. Тинькофф развивает IT-индустрию, поддерживает комьюнити и делится экспертизой.
Raft AI Labs — это подразделение компании Raft, специализирующееся на разработке и интеграции решений с использованием новейших AI-технологий. С помощью передовых технологий и инновационных подходов они преобразуют и оптимизируют бизнес-процессы, повышая их производительность и эффективность.
VK — это более 200 технологичных проектов, свыше 11 000 сотрудников и более 20 лет опыта создания высоконагруженных интернет-сервисов. ВКонтакте, Одноклассники, VK Cloud, Дзен, Маруся, VK Play — это лишь часть продуктов VK, которыми ежедневно пользуются миллионы людей по всей стране.
«Сфера» — универсальная экосистема продуктов для производства технологических решений, которая включает в себя более 40 инструментов для управления разработкой, тестированием, эксплуатацией программного обеспечения, а также инженерных инструментов для работы с исходным кодом и инструментами мониторинга рабочих станций и анализа бизнес-процессов.
Создают цифровой банк с лучшим пользовательским опытом, персонализацией продуктов и быстрым внедрением изменений. У них все быстро и просто: принимайте решения сами и смотрите, как на ваших глазах строчки кода превращаются в реальную пользу для клиентов.
Яндекс — технологическая компания, которая создает инновационные продукты на основе машинного обучения и нейронных сетей. Команда талантливых математиков и программистов развивает самую популярную в России поисковую систему и более 85 пользовательских сервисов, которые помогают людям в повседневных заботах.
Raft AI Labs — это подразделение компании Raft, специализирующееся на разработке и интеграции решений с использованием новейших AI-технологий. С помощью передовых технологий и инновационных подходов они преобразуют и оптимизируют бизнес-процессы, повышая их производительность и эффективность.
Делают IТ для ритейла реального времени. IТ-продукты компании автоматизируют разные этапы цепочки создания ценности для клиента доставки: закупки, логистику, работу дарксторов, сборку и доставку заказа до двери, управление промокампаниями и остальные этапы большого процесса. Используют интеллектуальные системы прогнозирования, а все этапы выполнения заказа автоматизируют роботическими системами. Их IТ-решения помогают создавать один из самых быстрорастущих бизнесов в стране: в 2020 году их IТ-продукты помогали доставлять 1.6 миллиона заказов в месяц в 4 городах России, сейчас — более 10 миллионов заказов в месяц в более чем 60 городах.
Rambler's Top100