Проект
по
“Откриване на знания в данни”,
летен семестър 2016/2017
Спас Кючуков, ФН 25432
Мария Паскова, ФН 25311
Димитър Чаушев, ФН 25336
Класификация на изображения
Данните
Cifar10 - 60 000 цветни изображения с размер 32 x 32
Формат на данните
- 5 множества за трениране по 10000 изображения
-
1 множество за тестване от 10000 изображения
- В тестовото множество има точно по 1000 изображения от всеки клас
-
Обучителните са по-разнообразни
-
Всеки пример е вектор с дължина 3072
- 32 x 32 = 1024 пиксела x 3 цвята = 3072
Подходи
- constant
- random
- единичен байт, най-чест клас
- 1NN
- CNN с TensorFlow
- MobileNet
- k-Means
k Nearest Neigbors
k = 1
Each image is represented as a point in the 3072 dimension space.
For each point we want to classify, we search it's nearest neighbor and assign it the same class.
Distance is measured by L1 distance:
Precision: 30%
Convolutional Neural Network with TensorFlow
Input:
- original images
- distorted images
- randomly cropped 24x24 pixels
- randomly flipped from left to right
- random distortion of the brightness
- random distortion of the contrast
The process pipeline includes:
convolution and rectified linear activations, max pooling and local response normalization
Convolutional Neural Network with TensorFlow
Precision: 86.8%
MobileNet
Базира се на разделима по дълбочина конволюция
Постигнати резултати
- constant, random - 10%
- единичен байт, най-чест клас - 18% (байт 2072)
- kNN, k = 1 - 30%
- CNN с TensorFlow - 86.8% след 75 120 епохи
- MobileNet - 64.9% след 31758 епохи
- MobileNet - 81.9% след 65000 епохи
- k-Means - не показа добри клъстери (съвпадащи с действителните класове)
Въпроси?
DataMining Final
By Mariq Paskova
DataMining Final
- 619