Программа учебной дисциплины
«Анализ социальных сетей»
ФКН • Департамент анализа данных и ИИ • Язык: русский • Учебный год: 2025
ПУД и Система оценивания
Аннотация
Курс знакомит с методами вычислительных социальных наук для анализа сетевых и текстовых данных. Три блока: эксплоративный анализ сетей, динамика и распространение в сетях, графовый ML (эмбеддинги и GNN).
- Сбор, предобработка, анализ и визуализация сложноструктурированных данных.
- Акцент на сетевом анализе текстовой информации.
- Групповой проект (1–3 студента) с исследовательскими и прикладными задачами.
Цели освоения
- Понимать задачи SNA, ключевые методы и алгоритмы.
- Формализовывать задачи на языке теории графов.
- Выбирать адекватные инструменты анализа.
- Навыки Python для сетевого анализа и визуализации.
- Анализ сетей реального мира; сравнение и обобщение.
Содержание курса (1/3)
- Введение в Network Science — задачи, источники данных; практика: Gephi.
- Базовые определения I (метрики целого графа) — пути, диаметр, кластеризация.
- Инструменты анализа — форматы графов и тулчин.
- Базовые определения II (метрики вершин) — betweenness, closeness, PageRank, degree, cores, motifs, HITS, двудольные графы. Практика: NetworkX/igraph.
- Community Detection — модульность, спектральные методы, Лувен/Лейден; практика: Python.
Содержание курса (2/3)
- Block Modeling — типы, алгоритмы, матрица изображений и интерпретация.
- Сетевые модели — Эрдёш–Реньи, preferential attachment, small-world; практика: генерация графов.
- Распространение/эпидемиология — SI/SIS/SIR, слухи; практика: ndlib.
- Графовые эмбеддинги — unsupervised, factorization, random walk; практика: link prediction.
- GNN I — message passing, DGL; практика: классификация узлов.
Содержание курса (3/3)
- GNN II — link prediction, классификация графов, SOTA особенности.
- Текстовые графы и KGs — анализ сообщений, JODIE; практика: Entity Linking в DGL.
- Графовые БД — Neo4j и др.; поиск: FAISS, Gensim, Elasticsearch.
- Темпоральные графы — модели, структуры данных, динамические процессы.
- Гостевая лекция — применимость SNA (рекомендательные системы и др.).
Форматы и технологии
Контроль
- Квизы (каждые два семинара).
- Групповой проект (1–3 студента).
Инфраструктура
- VK (запись лекций), Slides.
- Python; Google Colab для ДЗ.
- Google Forms (квизы), Google Sheets (ведомость).
Коммуникация
- Общий канал/чат (Telegram).
- Бот для загрузки ДЗ (опционально).
- Общий репозиторий материалов.
- Консультации по запросу.
Система оценивания — формулы
Текущая активность
Ghw = Quiz1..N / 2 + Contest1..M / 2
Contest1 — сообщества; Contest2 — распространение; Contest3 — кредитный скоринг.
Проект
Gpr = CP1 + CP2 · 20 + Research Proposal · 10 + Preprocessing & Data Loading · 10 + EDA · 20 + Research Hypothesis Validation · 10 + Interpretation · 10 + Project Presentation · 10 + Final Paper · 20
CP1/CP2 — сдача промежуточных результатов в срок.
Итог: G = 0.5 · Ghw + 0.5 · Gpr
Экзамен / автомат
- Если G ≥ 6.0 — возможен автомат, равный накопленной оценке.
- Если G < 6.0 — устный экзамен (3 вопроса).
Оценка за экзамен: Gex = 0.6 · questions(mark) + 0.4 · G
Точные формулировки вопросов см. в списке экзаменационных тем.
Календарный план (кратко)
Недели 1–5
- Введение; База I–II; Инструменты.
- Quiz 1; CP1; Community Detection (релиз контеста).
Недели 6–11
- Block Modeling; Сетевые модели; Эпидемии.
- Embeddings; GNN I–II; Quiz 2–3; Contest1/2.
Недели 12–16
- KGs & JODIE; БД; Темпоральные графы.
- Quiz 4; CP2; Гостевая лекция; Защита проектов.
Вопросы?
Версия 2025‑09 • Детали (в т.ч. контесты/квизы) могут уточняться в первые 1–2 недели семестра.
deck
By karpovilia
deck
- 43