На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

2
Ожидается:
16 Июня 2024

В Институте систем информатики им. А.П. Ершова СО РАН исследовались проблемы извлечения и обработки данных из социальных сетей.

26.02.2016

Сложно представить современный мир без социальных сетей. Это удобное средство общения между людьми, кроме того, сети открывают новые возможности для анализа потоков информации и поведения людей в процессе общения. Анализ структуры графов и текстовых данных, получаемых из социальных сетей, является наиболее эффективным методом изучения взаимодействий между их участниками. Важный элемент подобных исследований – создание программных инструментов, позволяющих извлекать из сетей данные и обрабатывать их.

В статье приведено довольно подробное описание разработанного программного комплекса для извлечения, обработки и анализа пользовательских данных. Эксперименты проводились по извлечению данных из сетей ВКонтакте и Twitter, хотя модуль извлечения системы имеет возможность функционального расширения практически на любую социальную сеть в зависимости от предоставляемого API. В целом система состоит из шести модулей, в том числе модуля отслеживания изменений в пользовательских данных и модуля построения графов.

Просматривать и обрабатывать невероятно большие потоки информации, которые постоянно обновляются, не только затруднительно, но и нерационально. По мнению авторов, сравнительно большая часть информации в социальных сетях представляет собой средство самовыражения, когда человек делает заметки для себя, не преследуя какие-то дополнительные цели наподобие рекламы, агитации и пр. Это предположение подтверждает официальная статистика, согласно которой, 40 % всех твитов можно отнести к светской беседе.

Чтобы выбрать существенную информацию из большого объема разнородных данных, необходимо разрабатывать определенные критерии. В ряде случаев достаточно ограничить число отслеживаемых пользователей и, к примеру, просматривать только тех, которые пользуются большей популярностью. Их называют лидерами мнений. Это люди, чье мнение оказывает на окружающую аудиторию большое влияние, формируя таким образом мнение остального сообщества.

Помимо количества подписчиков или друзей, лидера мнений характеризуют такие величины, как количество созданных сообщений, лайков, репостов и комментариев, которые собирают записи пользователя.

Не менее важной задачей является определение количества влияния, оказываемого на человека со стороны его окружения. Для ее решения предлагается адаптировать к социальным сетям теорию Латане социального влияния.

Подробное описание дается в статье «Программный комплекс для анализа данных из социальных сетей», авторы: Батура Т.В., Мурзин Ф.А., Проскуряков А.В.(Институт систем информатики им. А.П. Ершова СО РАН, г. Новосибирск).