Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Краткая история NLP: от T9 до ChatGPT

Нейронные сети, искусственный интеллект

Нейронные сети / Языковые модели

Доклад принят в программу конференции

Целевая аудитория

Data Scientist'ы и ML-инженеры с большим уклоном в NLP (но это необязательно, так как доклад обзорный).

Тезисы

В рамках доклада хочется осветить историческую хронологию того, как человечество пришло к текущему состоянию NLP-индустрии (появление ChatGPT и других LLM), какие челленджи, сложности и препятствия стояли перед сообществом и что нас может ждать дальше.

Обсудим следующее:
1. Состояние NLP до появления модели трансформера в 2017 году.
2. Что такое языковые модели.
3. Появление GPT-1, BERT, и как transfer learning изменил индустрию.
4. Появление GPT-2 и zero-shot.
5. Появление GPT-3, больших языковых моделей и few-shot.
6. Появление инструктивных моделей Flan-T5, Instruct-GPT, ChatGPT.
7. Их возможности, ограничения и перспективы.

AI-энтузиаст с 5+ годами в Data Science и машинном обучении. Занимается обучением больших языковых моделей в SberDevices, а именно GigaChat. В свободное время делает Open Source-проекты.

SberDevices

SberDevices — дочерняя компания Сбера, которая производит «умные» устройства. Это B2B- и B2C-девайсы для экосистемы с применением речевых технологий и виртуальным ассистентом на борту.

Занимается машинным обучением 7 лет. Главный эксперт по технологиям ИИ. Руководитель команды «нейронные сети» в SberDevices, участник команды разработчиков GigaChat, AI-евангелист, автор ruSBERT, kaggle, competition master.

SberDevices

SberDevices — дочерняя компания Сбера, которая производит «умные» устройства. Это B2B- и B2C-девайсы для экосистемы с применением речевых технологий и виртуальным ассистентом на борту.

Видео

Другие доклады секции

Нейронные сети, искусственный интеллект