Как системы мониторинга СМИ учатся анализировать текст | СКАН-Интерфакс

Система управления репутацией
мониторинга СМИ и соцмедиа

Главная Блог Интервью «Чёрный ящик» СКАНа: кто и как учит СКАН понимать новости

«Чёрный ящик» СКАНа: кто и как учит СКАН понимать новости

Возможности систем мониторинга СМИ растут из одного корня — способности извлекать и корректно интерпретировать данные из массы неструктурированной информации. К примеру, система мониторинга должна «видеть» из контекста новости, идет ли речь о «карате» как единице массы, о группе компаний «Карат» из Екатеринбурга или о московском молочном заводе «Карат». О том, как организована обработка информации на естественных языках, рассказал «Нетологии» Иван Харченко, руководитель математико-лингвистического отдела системы управления репутацией и медиаанализа «СКАН-Интерфакс».

Задачи по анализу и извлечению информации из текстов, в том числе с помощью методов машинного обучения решают NLP-инженеры. NLP (от английского natural language processing) — это технологии обработки естественного языка.

В чем сложность автоматической обработки текста

Современные компьютеры способны понимать только числа и логические операции. Чтобы обрабатывать связный текст, нужно описать лингвистические закономерности и правила языке, понятном машине.  

Кроме того, язык изменчив — возникают новые понятия, меняется информационный фон и контексты употребления слов. Поэтому важно постоянно адаптировать алгоритмы и статистические модели обработки текста к изменяющимся условиям. Мы стремимся максимально учитывать обратную связь от пользователей СКАНа — так нам удаётся оперативно реагировать на объективные изменения языка.  

Где в СКАНе применяются NLP-технологии

Без преувеличения — везде.
Чтобы обработать текст новости, алгоритмы СКАНа распознают: 

О том, как NLP-инженеры обеспечивают полноту и качество анализа публичной информации — в статье для блога «Нетологии» на Хабре.

31.03.2022 12:01

Попробуйте технологии SCAN в деле

Вам будет интересно

Интервью

«Дзен» для бренд-коммуникаций: что нужно знать о возможностях платформы в 2023 году

В 2022 году из-за блокировки соцсетей часть медиаканалов перестала быть доступной, в то время как многомиллионная аудитория «Дзена» только растёт. О специфике площадки и возможностях, которые она предлагает бизнесу, поговорили на вебинаре с Ольгой Стукаловой, руководителем группы онбординга и развития бизнеса в «Дзене».

22.06.2023 12:07
Кейсы

Продвижение группы в ВК: какими способами это делают крупные бренды

Обычно для продвижения бизнеса одних публикаций в СМИ недостаточно. Некоторые компании, особенно малые предприятия, часто начинают свой путь к известности с соцсетей. После блокировок нескольких популярных площадок, их аудитория существенно сократилась, а многие российские бизнесы сразу же перестали вести там свои страницы. Одной из самых популярных российских соцсетей по-прежнему остается ВКонтакте.

28.09.2023 10:00
Будни пресс-службы

“Норникель” об Инфоповодах: «не ожидали, что так полезно»

Обратная связь клиентов помогает нам увидеть, как именно они применяют новый инструмент Инфоповоды и чего не хватает в функционале сервиса. Уверены, что читателям блога тоже интересен опыт коллег, поэтому делимся выдержками из интервью с сотрудником пресс-службы Заполярного филиала «Норникеля».

10.03.2023 19:44