Как системы мониторинга СМИ учатся анализировать текст | СКАН-Интерфакс

Система управления репутацией
мониторинга СМИ и соцмедиа

Блог «Чёрный ящик» СКАНа: кто и как учит СКАН понимать новости

«Чёрный ящик» СКАНа: кто и как учит СКАН понимать новости

Возможности систем мониторинга СМИ растут из одного корня — способности извлекать и корректно интерпретировать данные из массы неструктурированной информации. К примеру, система мониторинга должна «видеть» из контекста новости, идет ли речь о «карате» как единице массы, о группе компаний «Карат» из Екатеринбурга или о московском молочном заводе «Карат». О том, как организована обработка информации на естественных языках, рассказал «Нетологии» Иван Харченко, руководитель математико-лингвистического отдела системы управления репутацией и медиаанализа «СКАН-Интерфакс».

Задачи по анализу и извлечению информации из текстов, в том числе с помощью методов машинного обучения решают NLP-инженеры. NLP (от английского natural language processing) — это технологии обработки естественного языка.

В чем сложность автоматической обработки текста

Современные компьютеры способны понимать только числа и логические операции. Чтобы обрабатывать связный текст, нужно описать лингвистические закономерности и правила языке, понятном машине.  

Кроме того, язык изменчив — возникают новые понятия, меняется информационный фон и контексты употребления слов. Поэтому важно постоянно адаптировать алгоритмы и статистические модели обработки текста к изменяющимся условиям. Мы стремимся максимально учитывать обратную связь от пользователей СКАНа — так нам удаётся оперативно реагировать на объективные изменения языка.  

Где в СКАНе применяются NLP-технологии

Без преувеличения — везде.
Чтобы обработать текст новости, алгоритмы СКАНа распознают: 

О том, как NLP-инженеры обеспечивают полноту и качество анализа публичной информации — в статье для блога «Нетологии» на Хабре.

31.03.2022 12:01

Попробуйте технологии SCAN в деле

Вам будет интересно

Выбор редактора

«Нашей компании нужно бренд-медиа!»: как понять, что это действительно так

Многие компании смотрят на кейсы успешных бренд-медиа и хотят повторить этот опыт у себя. Но как рассчитать силы и понять, что компания готова к собственному медиа? Отвечаем в этой статье вместе с с Надеждой Папудогло, главным редактором интернет-изданий «Мел» и «Флакон».

27.12.2022 18:19
Будни пресс-службы

10 инструментов B2B PR, которые стоит попробовать

B2B-коммуникации требуют особенных подходов в силу специфики аудитории и ее поведения. Предлагаем вам 10 полезных инструментов B2B PR, которые мы в агентстве Fresh Russian Communications используем для решения задач наших клиентов, и которые рекомендуем попробовать вам, если вы еще этого не сделали. Большинство из них подойдут для B2B-компаний любой отрасли и потребуют от вас преимущественно интеллектуальных и творческих ресурсов.

22.09.2020 12:26
Интервью

Как PR-службам избежать сокращения в условиях нового кризиса. Мнение экспертов

Для PR-специалистов работа в условиях кризиса — естественное состояние, ведь компания особенно остро нуждается в грамотном управлении репутацией именно в переломные моменты. В то же время один неверный шаг в публичном поле может привести к репутационным и финансовым потерям. В новой статье для Sostav совместно с экспертами из сферы PR рассказали, как изменился контекст работы пресс-служб, и как им принести максимальную пользу своей компании.

07.06.2022 12:45