Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

Чистые метки для ML

BigData и машинное обучение

Инфраструктура ML

Доклад принят в программу конференции

Целевая аудитория

ML-инженеры, дата-сайентисты — те, кто использует данные для обучения ИИ.

Тезисы

Расскажу про связь качества моделей и меток, на которых она обучена, про способы улучшить качество меток, полученных от крауда (Toloka, MTurk и аналоги). Поделюсь историями из жизни — плохими и хорошими примерами, как можно организовать сбор меток, и как их качество помогает улучшить распознавание речи, распознавание текста по картинке, синтез речи и другие ML-модели.

Занимается DataScience, ML и аналитикой последние 10 лет.

Яндекс

Яндекс — технологическая компания, которая создает инновационные продукты на основе машинного обучения и нейронных сетей. Команда талантливых математиков и программистов развивает самую популярную в России поисковую систему и более 85 пользовательских сервисов, которые помогают людям в повседневных заботах.

Видео

Другие доклады секции

BigData и машинное обучение