Почему важно интегрировать ИИ в медиааналитику?
Ответ на этот вопрос дала директор департамента аналитики и управления данными АНО «Диалог» Юлия Тян
6 ноября в рамках ежегодной конференции Brand Analytics Conference прошла экспертная секция «ИИ и аналитика соцмедиа: что уже работает, и что нас ждет в ближайшем будущем». Директор департамента аналитики и управления данными АНО «Диалог» Юлия Тян рассказала об опыте внедрения ИИ-решений в операционную и исследовательскую деятельность департамента.
Особенность медиааналитики заключается в том, что этот инструмент позволяет своевременно узнавать о проблемах, при этом анализу подвергается огромный поток информации. Для ускорения и автоматизации работы появилась необходимость во внедрении искусственного интеллекта.
«Одна из ключевых задач и одновременно вызов — это прогнозирование, а именно прогнозирование различных социально значимых рисков. К этой нетривиальной и сложной задаче все подходят по-своему. У нас, например, прогноз подразумевает собой сигнализирование об определенных аномалиях, отклонениях, выявление определенного тренда. Это может быть рост комментариев или пользовательского интереса к инфоповодам и публикациям. Мы применяем инструменты, которые позволяют на основе наших данных выявлять динамику пользовательской активности и интерпретировать проблематику через LLM. Специально созданный сервис, который работает целиком на наших данных, 24/7 отслеживает такие аномалии в комментариях и присылает практически готовую аналитику»,
— рассказала Юлия Тян.
Кроме того, искусственный интеллект может применяться для определения тональности пользовательских реакций и кластеризации комментарийных трендов. Директор департамента аналитики и управления данными АНО «Диалог» рассказала об опыте решения этой задачи в компании:
«Мы в «Диалоге» со временем трансформировали для себя эту задачу. В ходе анализа мы концентрируемся не просто на балансе позитива и негатива, а на смысловом наполнении, анализе контекста: важно видеть, какой процент поддержки в комментариях, какой процент критики или другие ключевые тренды и т.д. Это уже не просто определение «позитив-негатив», это про продвинутую кластеризацию. Также мы научились учитывать контекст ветки комментариев и на качественно другом уровне классифицировать тексты по темам. Мы шагнули вперед в этой задаче и достигли точности определения темы в 91%. Это наша собственная модель с 560 млн параметров, обучающая выборка почти 250 тыс.».
На сегодняшний день можно выделить два основных направления применения искусственного интеллекта в медиааналитике: выявление точек напряжения и извлечение информации из больших массивов текста. Однако в работе присутствует ряд вызовов, среди них: продвинутая саммаризация и кластеризация для получения более качественной аналитики, определение объектная тональность и другие.
«Если говорить про извлечение информации из массивов текстов, я считаю, что объектная тональность и решение этой задачи, которое пока никто не нашел, — это определенный вызов для всей сферы»,
— добавила Юлия Тян.