Визуализация данных в Data Science

Андрей Лукьяненко

CV R&D Lead, MTS AI

Содержание

  • Что такое визуализация данных и зачем это нужно
  • Немного истории
  • Tufte
  • Софт для создания графиков
  • Типы графиков
  • Навыки для создания профессиональных визуализаций
  • Как делать хорошо и не делать плохо
  • Визуализации для задач машинного обучения

Почему важны визуализации

Почему важны визуализации

Tufte

  • Максимизация "data ink-ratio"
  • Минимизация вранья
  • Минимизация бесполезного
  • Использование правильного масштаба и названий

Python. Matplotlib

Python. Plotly

Python. Altair

R

Tableau

D3.js

Навыки

  • Визуализация данных
  • Графический дизайн, дизайн интерфейсов и UX
  • Сторителлинг
  • Color: Hue, Value/Lightness, Saturation/Chroma, RGB vs CMYK
  • Доступность
  • Style guide

Style guide

Улучшения

Улучшения

Улучшения

Улучшения

Улучшения

Улучшения

Улучшения

Улучшения

Что делать и не делать

  • Exploratory vs explanatory, показать то, что важно
  • Pie, 3D

Ссылки

Ссылки

Ссылки

Ссылки

Контакты