Saint HighLoad++ 2024 - Профессиональная конференция разработчиков высоконагруженных систем

Профессиональная конференция разработчиков высоконагруженных систем

24 и 25 июня 2024

Санкт-Петербург, DESIGN DISTRICT DAA in SPB

Разработка высоконагруженных сервисов с моделями OpenAI

Архитектуры и масштабируемость

API

Python

Оптимизация производительности

Работа с облачными сервисами

Расширение кругозора

Доклад отклонён

Целевая аудитория

1.Разработчики AI приложений. 2. Архитекторы AI приложений, кто ищет способы построить максимально быстрое приложения на основе сервисов Open AI и других языковых моделей 3. Продакт-менеджеры, работающих над проектами, связанными с AI и ищущие способы оптимизации медленных приложений, построенных вокруг языковых моделей

Тезисы

Все презентации конференции

В докладе разберем как добиться максимальной производительности при работе с LLM и Voice To Text моделями OpenAI.
Разберем архитектуру решения реального продукта для анализа аудиозаписей и то, каким образом сервис обрабатывает десятки тысяч аудиозаписей на одном аккаунте Open AI и имеет возможность горизонтально масштабироваться.
Рассмотрим все ограничения Open AI сервисов, возникшие проблемы на пути становления сервиса и этапы изменения архитектуры.

Александр Константинов

Raft

Занимается разработкой 10 лет. Работал в компаниях Raft, Akvelon, Microsoft, Evernote на высоконагруженных проектах. Сейчас занимается AI-направлением в компании Raft на позиции CTO.

Raft

В Raft разрабатывают и интегрируют решения с использованием новейших AI-технологий. Миссия компании — быть лидером индустрии внедрения AI, создавая инновационные решения, которые помогают клиентам получить значимые результаты для их бизнеса.

Видео

Другие доклады секции

Архитектуры и масштабируемость

Как реклама Яндекса генерирует GPT-нейросетями заголовки для 3 миллиардов объявлений, используя 22 GPU

Ольга Зайкова

Яндекс

О распределённых транзакциях

Владимир Комаров

-

Миграция банковского ядра на собственную разработку. Как выстроить процессы распространения данных?

Лев Осипов

Райффайзен Банк

Как работать с поставщиками на примере поиска доступных отелей

Иван Чернов

Островок!

Ищем кратчайший путь в Интернете

Алексей Учакин

EdgeЦентр

Мастер-класс «Разделим данные»

Алексей Лосев

Wildberries & Russ

Геораспределенные системы

Евгений Кузовлев

Т-Банк

Стенд метрик: как построить архитектуру для расчета тысячи метрик и попасть в SLA

Евгений Пак

Ozon

Кластеризация с помощью etcd

Петр Растегаев

Wildberries & Russ

Пайплайны записи своими руками: думали — велосипед, оказалось — паттерны

Роман Щербаков

Т-Банк

GraphQL: зачем на самом деле он нужен. Apollo Federation — дар бога

Олег Коровин

ecom.tech

Как регулярно терять один ДЦ и не волноваться?

Михаил Кабищев

Ozon

Как платформа A/B-тестов Яндекса превратилась в решение для всего Интернета — Varioqub

Данил Валгушев

Яндекс

Как научить почтовый сервер Exim под нагрузкой 1 000 000 писем/мин. переживать отказ ЦОД без простоя с помощью FUSE и Tarantool, а также развернуть такую систему в K8s

Максим Уймин

VK, Mail.ru

Микросервисы: жизнь после. Невыдуманные истории, о которых невозможно молчать

Иван Матвеев

Vi.Tech

Делаем бесконечную галерею в Яндекс.Диске: балуемся плюшками, кластеризацией и синхронизацией

Дмитрий Кривопальцев

Яндекс 360

Чего не хватает обычному сервису, чтобы стать cloud-native

Дмитрий Некрылов

Яндекс 360

Обновления данных в поиске за секунды. Быстробновляемые атрибуты в поисковом движке Ozon

Пётр Портнов

Ozon

Быстрый поиск на Redisearch в ленте операций для миллионов пользователей

Илья Сиванев

Т-Банк

Оптимизация баннерного демона в условиях резкого роста нагрузки

Артем Букин

VK, VK Реклама

Архитектура биллинга: как не стать единой точкой отказа

Илья Иванов

Яндекс 360

Как мы держим миллион RPS в рекламе, троттлим трафик и не теряем при этом деньги

Михаил Кириченко

VK, VK Реклама