Профессиональная конференция разработчиков высоконагруженных систем

"Сильный искусственный интеллект" у вас в подвале: как собрать мультимодальную LLM из опенсорса и настроить её под вашу задачу

Нейронные сети, искусственный интеллект

Python
Разработка библиотек, включая open source библиотеки
ML
Метрики

Доклад принят в программу конференции

Мнение Программного комитета о докладе

LLM сегодня - это не обязательно что-то платное, как сервис и с подключением в Интернет. Есть Open Source LLM, и некоторые считают, что они начинают обходить по качеству коммерческие. Иван поделится экспертным мнением по проблеме и расскажет, как собрать собственную LLM на базе Open Source.

Целевая аудитория

Специалисты по машинному обучению

Тезисы

Диалоговый агент на базе ChatGPT - это сейчас одно из наиболее эффективных средств автоматизации общения в практически любых бизнес-процессах, где это общение возникает, будь то деловая переписка, модерация контента в интернет-магазине или анализ диалогов в контакт-центре. А если общение - это не только текст, а ещё и, например, картинки (в духе "глянь, подходящий ли стиль у этой картинки для новогодней рекламы" или "эй, посмотри, на этой фотке точно нет запрещёнки"), то здесь поможет ChatGPT Vision.

Но в текущих реалиях далеко не всегда есть доступ к серверам OpenAI, на которых работает ChatGPT Vision. Также не всегда оправдана отправка данных на сторонние сервера по соображениям безопасности или экономики. Таких вот "не всегда" очень много. И что же делать в этом случае? Делать свою мультимодальную LLM! В своём докладе я расскажу, как можно собрать такую мультимодальную LLM из опенсорсных компонент на вашем железе, как правильно подготовить датасет для кастомизации этой мультимодальной LLM под вашу бизнес-специфику и, наконец, как оценить качество того, что получилось.

Люблю свою семью и машинное обучение, преподаю в НГУ, делаю нейросети, хожу в горы.

В настоящий момент работаю старшим преподавателем и научным сотрудником Новосибирского государственного университета. Вместе со своими учениками являюсь сооснователем стартапа "Сибирские нейросети".

С 2006 до 2013 года преподавал и занимался научными исследованиями в Донецком национальном техническом университете, затем перешёл в IT-индустрию и работал на различных должностях — от инженера-разработчика до специалиста по машинному обучению — в ряде компаний и университетов, таких как 2ГИС, Huawei, Global Logic, Data Monsters, МФТИ (DeepPavlov).

НГУ

Новосибирский государственный университет (НГУ) входит в топ-10 лучших российских университетов согласно QS World University Rankings. Механико-математический факультет, где я занимаюсь исследованиями по основному месту работы, является крупнейшим центром исследовательской и преподавательской деятельности по искусственному интеллекту в НГУ. Так, на факультете существует Инженерная школа для бакалавров, магистратура по прикладному машинному обучению и большим данным (совместно с Яндекс-ШАД), лаборатории факультета выполняют проекты по ИИ для индустриальных партнёров НГУ (например, https://nauka.tass.ru/nauka/18507183)

Видео

Другие доклады секции

Нейронные сети, искусственный интеллект