Как системы мониторинга СМИ учатся анализировать текст | Блог СКАН-Интерфакс

Система управления репутацией
мониторинга СМИ и соцмедиа

Главная Блог Новое в СКАНе «Чёрный ящик» СКАНа: кто и как учит СКАН понимать новости
Новое в СКАНе

2 минуты

«Чёрный ящик» СКАНа: кто и как учит СКАН понимать новости

Возможности систем мониторинга СМИ растут из одного корня — способности извлекать и корректно интерпретировать данные из массы неструктурированной информации. К примеру, система мониторинга должна «видеть» из контекста новости, идет ли речь о «карате» как единице массы, о группе компаний «Карат» из Екатеринбурга или о московском молочном заводе «Карат». О том, как организована обработка информации на естественных языках, рассказал «Нетологии» Иван Харченко, руководитель математико-лингвистического отдела системы управления репутацией и медиаанализа «СКАН-Интерфакс».

Задачи по анализу и извлечению информации из текстов, в том числе с помощью методов машинного обучения решают NLP-инженеры. NLP (от английского natural language processing) — это технологии обработки естественного языка.

В чем сложность автоматической обработки текста

Современные компьютеры способны понимать только числа и логические операции. Чтобы обрабатывать связный текст, нужно описать лингвистические закономерности и правила языке, понятном машине.  

Кроме того, язык изменчив — возникают новые понятия, меняется информационный фон и контексты употребления слов. Поэтому важно постоянно адаптировать алгоритмы и статистические модели обработки текста к изменяющимся условиям. Мы стремимся максимально учитывать обратную связь от пользователей СКАНа — так нам удаётся оперативно реагировать на объективные изменения языка.  

Где в СКАНе применяются NLP-технологии

Без преувеличения — везде.
Чтобы обработать текст новости, алгоритмы СКАНа распознают: 

О том, как NLP-инженеры обеспечивают полноту и качество анализа публичной информации — в статье для блога «Нетологии» на Хабре.

Опубликовано: 31.03.2022
Обновлено: 01.10.2024

Попробуйте технологии SCAN в деле

Вам будет интересно

Новое в СКАНе

Обновление мобильного приложения СКАНа: добавили онбординг, фильтр по Топ-источникам и сортировку по охвату

Мобильное приложение СКАН — это помощник для тех, кто занимается мониторингом инфополя в режиме реального времени и хочет держать руку на пульсе, даже когда нет возможности находиться за рабочим столом. В приложении можно в несколько кликов настроить ленту под свои запросы и получать мгновенные уведомления о самом важном на своём смартфоне или планшете. Рассказываем, что и зачем добавили в последнем обновлении мобильного приложения СКАН.

07.09.2022 16:28
Новое в СКАНе

СКАН запустил новый модуль анализа деловой репутации и оценки рисков по СМИ в «СПАРК-Интерфакс»

Новый сервис «Оценка деловой репутации» позволяет автоматически отслеживать упоминания в СМИ по пользовательским спискам компаний и персон и ежедневно получать отчёты с «рисковыми» новостями.

24.03.2022 16:38