Как мы подружили биореакторы и ML

BigData и машинное обучение

Реальный сектор

ETL
ML
Обработка данных
Инфраструктура

Доклад принят в программу конференции

Целевая аудитория

Специалисты по анализу данных и инженеры по автоматизации производственных процессов.

Тезисы

Когда речь заходит о машинном обучении в фармацевтических компаниях, таких как наш BIOCAD, то большинство специалистов подразумевает участие Data Scientist'ов в процессе разработки лекарственных препаратов. В данном докладе мы бы хотели посмотреть на этот вопрос немного под другим углом и рассказать о том, какие еще задачи решаются при помощи машинного обучения в фармацевтических компаниях, в том числе как алгоритмы машинного обучения помогают решать задачи на производственных линиях и какую архитектуру мы для этого используем.

В настоящее время подавляющее большинство крупных производственных компаний по всему миру собирают огромные объемы данных со своего оборудования для решения широкого круга аналитических задач: от предсказывания поломок оборудования до оценки качества выпускаемой продукции. А, как известно, для эффективного решения задач в области анализа данных требуется построить удобную, легко масштабируемую и отказоустойчивую инфраструктуру для выполнения всего пайплайна: от обучения до работы готовых моделей в реальном времени. Да ещё и такую, чтобы можно было быстро и безболезненно внедрять изменения практически в любую составляющую пайплайна.

Несмотря на большое количество вендоров, которые предлагают свои продукты на разных стадиях автоматизации производственного процесса, мы выбрали OpenSource-решения. Будут затронуты вопросы взаимодействия с программно-техническими средствами АСУТП, MLOps-архитектура, а также рассмотрен конкретный пример применения методов машинного обучения для создания виртуального датчика процесса культивирования в биореакторе.

Также расскажем о том, с какими трудностями мы столкнулись при разработке, и каким образом выстраивалось взаимодействие между специалистами службы АСУ ТП и специалистами по машинному обучению.

Аналитик данных.

BIOCAD

BIOCAD — одна из крупнейших биотехнологических инновационных компаний в России, ведущая полный цикл создания лекарственных препаратов от поиска молекулы до массового производства и маркетинговой поддержки. Препараты предназначены для лечения онкологических, аутоиммунных и других социально значимых заболеваний.

Руководитель группы анализа данных.

BIOCAD

BIOCAD — одна из крупнейших биотехнологических инновационных компаний в России, ведущая полный цикл создания лекарственных препаратов от поиска молекулы до массового производства и маркетинговой поддержки. Препараты предназначены для лечения онкологических, аутоиммунных и других социально значимых заболеваний.

Видео

Другие доклады секции

BigData и машинное обучение