Сервис для поиска событий на основе актуальных
данных социальных сетей
Сервис поиска событий CityEvents (акселератор города) — это система, позволяющая конечным пользователям, не обладающим глубокими знаниями в области компьютерных наук и не имеющим в своем распоряжении мощных вычислительных ресурсов, выполнять аналитические запросы на контексте геопространственных областей, тем самым устраняя критические препятствия на пути цифровой трансформации современных городов.
Преимущества CityEvents как независимого сервиса:
— Способность выявлять все события, а не только те, что соответствуют заданным критериям, как это реализовано на коммерческих агрегаторах, аналогичных KudaGo
— Высокая чувствительность сервиса, которая обеспечивается благодаря тому, что сетка активностей подбирается динамически с помощью разработанного сверточного дерева квадрантов, фильтрации неверных данных, спама и рекламного контента производимой алгоритмами машинного обучения (random forest и кластеризация)
— Использование ретроспективных данных для настройки точности обнаружения событий (уникально, так как механизм поиска событий напрямую не реализован ни у одного конкурента)
Преимущества сервиса как интеллектуального объекта в составе платформы поддержки жизненного цикла интеллектуальных объектов на основе больших данных:
— Автоматизация процесса сбора, обработки и преобразования данных в едином пространстве с разнородных источников в Интернете
— Возможность тиражирования для различных областей применения, описываемых разными моделями потребления
— Удобное ядро для интеграции с существующими система городских мероприятий (KudaGO, Afisha, и т.д.), включая облачную модель
В XXI веке невозможно представить мир без постоянного использования социальных сетей. Instagram, Twitter, VK не только прочно вошли в жизнь современного человека, но и ежедневно накапливают дынные о миллиардах людей по всему миру. Пользователи активно делятся своими мыслями, впечатлениями, местоположением, а также происходящими в их жизни событиями — социальные медиа содержат бесценную информацию, в том числе о взаимодействии жителей и туристов с городской средой. Но как обеспечить качественный и актуальный мониторинг и идентификацию городских событий с помощью данных из социальных сетей?
В этом способен помочь наш сервис поиска мероприятий, разработанный с помощью платформы поддержки жизненного цикла интеллектуальных объектов на основе больших данных.
Наиболее естественным и очевидным подходом является интерпретация в качестве события всплеска активности в конкретной зоне, однако, в таком случае перед исследователями возникает задача корректного определения и оценки такой области. Для ее решения нами был разработан новый способ разбиения пространства — с помощью свёрточного дерева, каждый элемент которого соответствует некоторой ограниченной области, обладающей заданным уровнем активности. Таким образом, более активные области, например центр города, поделены на большое число элементов, а менее активные покрываются несколькими крупными областями. Принцип построения дерева схож со свёрточными нейронными сетями: на первом шаге выполняются последовательные операции свёртки, что позволяет добиться более плавных переходов и точнее определить границу области с высокой активностью.
На основе свёрточного дерева определяется базовое состояние города и для каждой комбинации из месяца, часа и типа дня недели (рабочий или выходной) строятся сетки со средним числом постов. Таким образом, учитывается разный уровень активности пользователей как в разное время суток, так и в различные сезоны. Затем, используя актуальные данные, сетки адаптируются и, если число постов превышает заданный порог, данная группа сообщений отмечается как потенциальный кандидат на событие. Для найденного кандидата строится граф связи между сообщениями с помощью хэштегов и упоминаний людей. Если количество сообщений, посвященных одной теме, оказывается больше, чем определенное значение, значит было обнаружено событие.
Таким образом могут быть обнаружены мероприятия различных масштабов от общегородского парада до новой работы Бэнкси, от массового забега студентов до главной баскетбольной игры сезона. Причем можно не просто найти события, но и определить время их начала и конца, регулярность и заинтересованность в них той или иной аудитории.
Данный сервис может оказаться крайне полезным для бизнеса, особенно для компаний в сфере услуг. Ведь получая актуальные данные из социальных сетей и анализируя события не только по тематике, но и по расположению, можно легко определить точки интереса заданной целевой аудитории, учесть уровень конкуренции в рассматриваемой области и спрогнозировать места для потенциального размещения и развития бизнеса.
Также данный сервис используется как площадка (мета-сервис) для тиражирования функционального ядра под разные прикладные задачи.
Например, для борьбы с одиночеством во время пандемии весной 2020 года была создана интерактивная карта, позволяющая увидеть, чем во время самоизоляции заняты люди в другой стране, в другом городе или в соседнем доме. Объединенные хештегом #HowWeSurvive посты аккумулируются и отображаются на карте. Благодаря сервису поиска событий CityEvents, удалось также довольно просто и эффективно перенести важный для россиян «Бессмертный полк» в онлайн-пространство, не утратив душевности и международного масштаба движения (mypolk.online).
Email для обратной связи: dnasonov@itmo.ru