В МТУСИ создали сервис для автоматического выявления опасного и недостоверного контента
Московский технический университет связи и информатики (МТУСИ) объявил о создании сервиса мониторинга и классификации нежелательного контента. Разработка использует машинное обучение и современные методы обработки текстов для автоматического выявления недостоверных и опасных данных в онлайн-публикациях.
Российские ученые из МТУСИ разработали интеллектуальный сервис, который способен автоматически выявлять потенциально опасную, недостоверную и нежелательную информацию в интернет-публикациях. Как сообщили в пресс-службе вуза, система основана на технологиях машинного обучения и современных методах анализа текстовых данных.
Как работает сервис?
В основе разработки — несколько ключевых модулей. В их числе аутентификация и авторизация пользователей, модуль работы со словарем, логирование и аналитические компоненты. По словам профессора МТУСИ Юрия Леохина, система анализирует текст на трех уровнях.
Первый уровень — поиск по словарю, который позволяет сопоставлять текст с ключевыми словами. Второй — морфологический анализ, учитывающий различные словоформы за счет лемматизации. Третий, самый сложный — интеллектуальный анализ с использованием предобученной модели на основе трансформеров.
Разработчики особо подчеркивают высокую точность анализа текстовых данных. Это достигается за счет комбинации лингвистических алгоритмов и методов машинного обучения, которые позволяют системе не просто распознавать ключевые слова, но и понимать контекст.
Планы на будущее
Представители МТУСИ уточнили, что работа над сервисом не останавливается. В ближайших планах исследователей — совершенствовать модели машинного обучения, расширять словарь анализа и повышать точность классификации контента.
Создание подобных инструментов особенно актуально в условиях роста объемов информации в интернете. Разработка МТУСИ может стать основой для создания систем автоматической модерации и фильтрации, что востребовано как на уровне государственных структур, так и среди частных платформ.
При этом важно отметить, что текст остается в фокусе: сервис работает исключительно с текстовой информацией, что позволяет избежать ложных срабатываний, характерных для более простых систем.
Комментарии
0 всего