Программа учебной дисциплины
«Анализ социальных сетей»

ФКН • Департамент анализа данных и ИИ • Язык: русский • Учебный год: 2025

ПУД   и   Система оценивания

Аннотация

Курс знакомит с методами вычислительных социальных наук для анализа сетевых и текстовых данных. Три блока: эксплоративный анализ сетей, динамика и распространение в сетях, графовый ML (эмбеддинги и GNN).

  • Сбор, предобработка, анализ и визуализация сложноструктурированных данных.
  • Акцент на сетевом анализе текстовой информации.
  • Групповой проект (1–3 студента) с исследовательскими и прикладными задачами.

Цели освоения

  • Понимать задачи SNA, ключевые методы и алгоритмы.
  • Формализовывать задачи на языке теории графов.
  • Выбирать адекватные инструменты анализа.
  • Навыки Python для сетевого анализа и визуализации.
  • Анализ сетей реального мира; сравнение и обобщение.

Содержание курса (1/3)

  1. Введение в Network Science — задачи, источники данных; практика: Gephi.
  2. Базовые определения I (метрики целого графа) — пути, диаметр, кластеризация.
  3. Инструменты анализа — форматы графов и тулчин.
  4. Базовые определения II (метрики вершин) — betweenness, closeness, PageRank, degree, cores, motifs, HITS, двудольные графы. Практика: NetworkX/igraph.
  5. Community Detection — модульность, спектральные методы, Лувен/Лейден; практика: Python.

Содержание курса (2/3)

  1. Block Modeling — типы, алгоритмы, матрица изображений и интерпретация.
  2. Сетевые модели — Эрдёш–Реньи, preferential attachment, small-world; практика: генерация графов.
  3. Распространение/эпидемиология — SI/SIS/SIR, слухи; практика: ndlib.
  4. Графовые эмбеддинги — unsupervised, factorization, random walk; практика: link prediction.
  5. GNN I — message passing, DGL; практика: классификация узлов.

Содержание курса (3/3)

  1. GNN II — link prediction, классификация графов, SOTA особенности.
  2. Текстовые графы и KGs — анализ сообщений, JODIE; практика: Entity Linking в DGL.
  3. Графовые БД — Neo4j и др.; поиск: FAISS, Gensim, Elasticsearch.
  4. Темпоральные графы — модели, структуры данных, динамические процессы.
  5. Гостевая лекция — применимость SNA (рекомендательные системы и др.).

Форматы и технологии

Контроль

  • Квизы (каждые два семинара).
  • Групповой проект (1–3 студента).

Инфраструктура

  • VK (запись лекций), Slides.
  • Python; Google Colab для ДЗ.
  • Google Forms (квизы), Google Sheets (ведомость).

Коммуникация

  • Общий канал/чат (Telegram).
  • Бот для загрузки ДЗ (опционально).
  • Общий репозиторий материалов.
  • Консультации по запросу.

Система оценивания — формулы

Текущая активность

Ghw = Quiz1..N / 2 + Contest1..M / 2

Contest1 — сообщества; Contest2 — распространение; Contest3 — кредитный скоринг.

Проект

Gpr = CP1 + CP2 · 20 + Research Proposal · 10 + Preprocessing & Data Loading · 10 + EDA · 20 + Research Hypothesis Validation · 10 + Interpretation · 10 + Project Presentation · 10 + Final Paper · 20

CP1/CP2 — сдача промежуточных результатов в срок.


Итог: G = 0.5 · Ghw + 0.5 · Gpr

Экзамен / автомат

  • Если G ≥ 6.0 — возможен автомат, равный накопленной оценке.
  • Если G < 6.0 — устный экзамен (3 вопроса).

Оценка за экзамен: Gex = 0.6 · questions(mark) + 0.4 · G

Точные формулировки вопросов см. в списке экзаменационных тем.

Календарный план (кратко)

Недели 1–5

  • Введение; База I–II; Инструменты.
  • Quiz 1; CP1; Community Detection (релиз контеста).

Недели 6–11

  • Block Modeling; Сетевые модели; Эпидемии.
  • Embeddings; GNN I–II; Quiz 2–3; Contest1/2.

Недели 12–16

  • KGs & JODIE; БД; Темпоральные графы.
  • Quiz 4; CP2; Гостевая лекция; Защита проектов.

Вопросы?

Версия 2025‑09 • Детали (в т.ч. контесты/квизы) могут уточняться в первые 1–2 недели семестра.

deck

By karpovilia