АБТ, группа Сбер
Разработка AI-агентов и LLM-based проектов, построение их harness: evals/benchmarks, оценка эффектов и качества.
Отвечаю за benchmark-first подход, технический ресерч вокруг AI и его встраивания в реальные процессы бизнеса, повышаю культуру работы с AI и прививаю любовь к качеству данных.
Ключевые проекты и моя роль:
Datograph
Собран с нуля до прода. AI-агент и copilot для описания реляционных БД, поиска в них персональных данных и dead data. Снижение времени на описание данных на 70%, избавление команд от рутин и потенциальное уменьшение размера БД до 18% за счет поиска неиспользуемых данных.
proeval
Собран с нуля до прода. Конструктор evals и бенчмарков для LLM-based/RAG продуктов: качество ответов, retrieval, фильтры, выделение сущностей и диалоговые сценарии. Повышение стабильности запускаемых решений и оптимизация до 40% за счет платформы экспериментов.
VoiceRobot
Разработка системы оценки качества голосового реалтайм-ассистента (ASR / TTS / LLM).
AI-аналитика
Построение проекта с нуля для ускорения получения сигналов по изменениям бизнес-метрик. Ускорение до 4 раз получения сигналов из DWH по изменению бизнес-метрик линейных процессов.
Document Copilot
Копилот для юристов: разработка LLM-based решения для быстрой обработки сложных межведомственных документов, ускоряющего их обработку до 8 раз.
Elementary / АБТ, группа Сбер
Запустил с нуля и масштабировал платформу по разметке мультимодальных данных любой сложности. Найм первых сотрудников, формирование культуры, управление кросс-командой из 16 человек (и нескольких сотен разметчиков через лидов), product vision и стратегия, проектирование архитектуры, разработка hands-on, упаковка в продукт, превращение SaaS в коробочное решение для внешних заказчиков, pre-sale сопровождение и технические демо.
Elementary
Сбор, разметка, авторазметка, data pipelines, synthetic data generation. Через платформу прошли данные для Kandinsky, GigaChat, MERA, множества проектов R&D. Ускорение создания заданий на разметку и time-to-market разметки с нескольких дней до часа. В пике на платформе 11 тысяч сотрудников онлайн работали полный рабочий день.
Беттинг-продукты
Управление разработкой и командой, общая ответственность за несколько сложных real-time-streaming продуктов из физического мира беттинг-тематики. Работа с командами математиков, лидирование hardware-инженеров и разработчиков.
Интеграторы
Различные сложные внедрения технологий в ecom, банки, финтех, авиакомпании, девелоперы и другие.