Михаил Васильев

Михаил Васильев Makves (входит в группу компаний "Гарда")

В этом докладе я расскажу о том, как мы использовали NLP решения для расширения возможностей DCAP (data-centric audit and protection) системы компании Makves. Мы обсудим, почему обработка неструктурированных текстовых данных без нейросетей является сложной задачей и как мы преодолели эти вызовы. Я поделюсь нашим опытом сбора и подготовки датасета, а также раскрою трюки и методы, которые мы применяли для оценки качества полученных решений. Также рассмотрим ограничения, с которыми мы столкнулись при продуктивизации моделей, и как мы их преодолели. Доклад будет полезен как опыт реального внедрения NLP функционала в работающий продукт.
Компания Makves (входит в группу компаний "Гарда") разрабатывает российскую DCAP (data-centric audit and protection) систему для защиты корпоративных данных. Для анализа неструктурированных данных необходимо применять нейросети. Я хочу рассказать о проблемах, с которыми мы (по сути — активно растущий стартап) столкнулись при создании нейросетей, от этапа сбора и разметки данных и до создания нескольких микросервисов.

Остались вопросы?

Связаться с нами