Проект

по
“Откриване на знания в данни”,

летен семестър 2016/2017

Спас Кючуков, ФН 25432

Мария Паскова, ФН 25311

Димитър Чаушев, ФН 25336

Класификация на изображения

Данните

Cifar10 - 60 000 цветни изображения с размер 32 x 32

https://www.cs.toronto.edu/~kriz/cifar.html

Формат на данните

5 множества за трениране по 10000 изображения
1 множество за тестване от 10000 изображения
В тестовото множество има точно по 1000 изображения от всеки клас
Обучителните са по-разнообразни
Всеки пример е вектор с дължина 3072
- 32 x 32 = 1024 пиксела x 3 цвята = 3072

Подходи

constant
random
единичен байт, най-чест клас
1NN
CNN с TensorFlow
MobileNet
k-Means

k Nearest Neigbors

k = 1

Each image is represented as a point in the 3072 dimension space.

For each point we want to classify, we search it's nearest neighbor and assign it the same class.

Distance is measured by L1 distance:

Precision: 30%

Convolutional Neural Network with TensorFlow

Input:

original images
distorted images
- randomly cropped 24x24 pixels
- randomly flipped from left to right
- random distortion of the brightness
- random distortion of the contrast

The process pipeline includes:

convolution and rectified linear activations, max pooling and local response normalization

Convolutional Neural Network with TensorFlow

Precision: 86.8%

MobileNet

Базира се на разделима по дълбочина конволюция

Постигнати резултати

constant, random - 10%
единичен байт, най-чест клас - 18% (байт 2072)
kNN, k = 1 - 30%
CNN с TensorFlow - 86.8% след 75 120 епохи
MobileNet - 64.9% след 31758 епохи
MobileNet - 81.9% след 65000 епохи

k-Means - не показа добри клъстери (съвпадащи с действителните класове)

Въпроси?

Made with Slides.com