Ключевыми модулями разработки стали аутентификация пользователей, работа со словарём, лемматизация для учёта словоформ и аналитические компоненты для повышения точности классификации.
Российские учёные из Московского технического университета связи и информатики (МТУСИ) создали интеллектуальный сервис для автоматического мониторинга и классификации нежелательного контента в интернет-публикациях. Об этом РИА Новости сообщили в пресс-службе вуза.
Разработка использует технологии машинного обучения и современные методы обработки текстовых данных, что позволяет системе самостоятельно выявлять публикации, содержащие потенциально опасную, недостоверную или нежелательную информацию.
«Ученые МТУСИ создали интеллектуальный сервис мониторинга и классификации нежелательного контента в онлайн-публикациях, способный автоматически выявлять потенциально опасную, недостоверную и нежелательную информацию с использованием технологий машинного обучения и современных методов обработки текстовых данных», — говорится в сообщении.
Одним из главных преимуществ разработки исследователи называют высокую точность анализа. Система построена на модульной архитектуре, включающей компоненты аутентификации и авторизации пользователей, модуль работы со словарём, инструменты логирования и аналитические блоки.
«Поиск по словарю обеспечивает базовый уровень анализа за счет сопоставления текста с ключевыми словами. Морфологический анализ позволяет учитывать различные словоформы за счет лемматизации. Интеллектуальный анализ реализован с использованием предобученной модели на основе трансформеров», — пояснил профессор МТУСИ Юрий Лёхин.