Проект

по
“Откриване на знания в данни”,

летен семестър 2016/2017

Спас Кючуков, ФН 25432

Мария Паскова, ФН 25311

Димитър Чаушев, ФН 25336

Класификация на изображения

Данните

Cifar10 - 60 000 цветни изображения с размер 32 x 32

https://www.cs.toronto.edu/~kriz/cifar.html

Формат на данните

  • 5 множества за трениране по 10000 изображения
  • 1 множество за тестване от 10000 изображения
     
  • В тестовото множество има точно по 1000 изображения от всеки клас
  • Обучителните са по-разнообразни
     
  • Всеки пример е вектор с дължина 3072
    • 32 x 32 = 1024 пиксела x 3 цвята = 3072

 

Подходи

  • constant
  • random
     
  • единичен байт, най-чест клас
  • 1NN
     
  • CNN с TensorFlow
  • MobileNet
     
  • k-Means

k Nearest Neigbors

k = 1

Each image is represented as a point in the 3072 dimension space.

 

For each point we want to classify, we search it's nearest neighbor and assign it the same class.

 

Distance is measured by L1 distance:

 

Precision: 30%

Convolutional Neural Network with TensorFlow

Input:

  • original images
  • distorted images
    • randomly cropped 24x24 pixels
    • randomly flipped from left to right
    • random distortion of the brightness
    • random distortion of the contrast

 

The process pipeline includes:

convolution and rectified linear activations, max pooling and local response normalization

Convolutional Neural Network with TensorFlow

Precision: 86.8%

MobileNet

Базира се на разделима по дълбочина конволюция

Постигнати резултати

  • constant, random - 10%
  • единичен байт, най-чест клас - 18% (байт 2072)

  • kNN, k = 1 - 30%
  • CNN с TensorFlow - 86.8% след 75 120 епохи
  • MobileNet - 64.9% след 31758 епохи
  • MobileNet - 81.9% след 65000 епохи
  • k-Means - не показа добри клъстери (съвпадащи с действителните класове)

Въпроси?

Made with Slides.com