Профессиональная конференция разработчиков высоконагруженных систем

Подходы к тестированию LLM-приложений

Нейронные сети, искусственный интеллект

Бэкенд / другое
Профилирование
Функциональное тестирование
Профилирование и отладка кода
Приёмочные и функциональные тесты
QA / другое
ML

Доклад отклонён

Целевая аудитория

Разработчики и QA, планирующие использование больших языковых моделей в своих проектах

Тезисы

Приложения, использующие большие языковые модели (LLM), становятся все более популярными в различных отраслях. Однако, тестирование таких приложений представляет собой сложную задачу.

LLM-приложения имеют свои особенности, которые необходимо учитывать при тестировании.

В докладе представлены современные методики и стратегии, которые были разработаны на основе последних достижений в данной области и личного опыта.

Тестирование функциональности и соответствия спецификациям.
Тестирование производительности и масштабируемости (время отклика, обработка запросов, использование ресурсов).
Тестирование безопасности и сохранения приватности данных.
Тестирование устойчивости модели к ошибкам ввода и непредвиденным условиям.
Определение и применение метрик качества для LLM-приложений

Технический консультант в ряде популярных интернет-сервисов.
Серийный технический сооснователь B2B-SaaS-стартапов и отец трех сыновей.

wikilect.com

В wikilect.com мы занимаемся решением задач бизнеса с использованием больших языковых моделей. Основные направления - чат-боты и корпоративные хранилища знаний.

Видео

Другие доклады секции

Нейронные сети, искусственный интеллект