Программа учебной дисциплины
«Анализ и визуализация сетей»

ФКН • Департамент анализа данных и ИИ • Язык: английский
2026

Ilia Karpov

  • ~30 Scopus papers
  • 30 Projects in NLP, SNA
  • CTO in 2 companies
  • Cofounder in 4 companies

Аннотация

Курс знакомит с методами вычислительных социальных наук для анализа сетевых и текстовых данных. Три блока: эксплоративный анализ сетей, динамика и распространение в сетях, графовый ML (эмбеддинги и GNN).

  • Сбор, предобработка, анализ и визуализация сложноструктурированных данных.
  • Акцент на сетевом анализе текстовой информации.
  • Групповой проект (1–3 студента) с исследовательскими и прикладными задачами.

Цели освоения

  • Понимать задачи SNA, ключевые методы и алгоритмы.
  • Формализовывать задачи на языке теории графов.
  • Выбирать адекватные инструменты анализа.
  • Навыки Python для сетевого анализа и визуализации.
  • Анализ сетей реального мира; сравнение и обобщение.

Содержание курса (1/3)

  1. Введение в Network Science — задачи, источники данных; практика: Gephi.
  2. Базовые определения I (метрики целого графа) — пути, диаметр, кластеризация.
  3. Инструменты анализа — форматы графов и тулчин.
  4. Базовые определения II (метрики вершин) — betweenness, closeness, PageRank, degree, cores, motifs, HITS, двудольные графы. Практика: NetworkX/igraph.
  5. Community Detection — модульность, спектральные методы, Лувен/Лейден; практика: Python.

Содержание курса (2/3)

  1. Block Modeling — типы, алгоритмы, матрица изображений и интерпретация.
  2. Сетевые модели — Эрдёш–Реньи, preferential attachment, small-world; практика: генерация графов.
  3. Распространение/эпидемиология — SI/SIS/SIR, слухи; практика: ndlib.
  4. Графовые эмбеддинги — unsupervised, factorization, random walk; практика: link prediction.
  5. GNN I — message passing, DGL; практика: классификация узлов.

Содержание курса (3/3)

  1. GNN II — link prediction, классификация графов, SOTA особенности.
  2. Текстовые графы и KGs — анализ сообщений, JODIE; практика: Entity Linking в DGL.
  3. Графовые БД — Neo4j и др.; поиск: FAISS, Gensim, Elasticsearch.
  4. Темпоральные графы — модели, структуры данных, динамические процессы.

Форматы и технологии

Контроль

  • Квизы (каждые два семинара).
  • Контесты

Инфраструктура

  • Zoom, Slides.
  • Python; Google Colab для ДЗ.
  • Google Forms (квизы), Google Sheets (ведомость).

Коммуникация

  • Общий канал/чат (Telegram).
  • Бот для загрузки ДЗ (опционально).
  • Общий репозиторий материалов.
  • Консультации по запросу.

Система оценивания — формулы

Текущая активность

G = Quiz1..N * 0.3 + Questions1..3 * 0.2 + Contest1..M * 0.5

Contest1 — сообщества;

Contest2 — распространение информации;

Contest3 — кредитный скоринг.

Экзамен / автомат

  • Если G ≥ 6.0 — возможен автомат, равный накопленной оценке.
  • Если G < 6.0 — устный экзамен (3 вопроса).

Оценка за экзамен: Gex = 0.6 · questions(mark) + 0.4 · G

Точные формулировки вопросов см. в списке экзаменационных тем.

Ссылка на канал курса

 

Вопросы?

 

Copy of deck

By karpovilia