Reconocimiento de caracteres utilizando redes neuronales
Universidad Nacional Jorge Basadre Grohmann
Dennis Juan Calluhuari Mamani 2009-34084
Paul Lionel Mesco Sota 2010-35541
Los sistemas de reconocimiento optico de caracteres
- Principio de los años 50
- Los primero sistemas OCR no eran capaces de reconocer caracteres o palabras manuscritos puesto que su metodología de reconocimiento no era lo suficientemente sofisticada
- Actualmente, los sistemas OCR son muy poderosos y complejos llegando a niveles de reconocimiento muy altos, en especial en el procesamiento de textos impresos.
Procesamiento
- Obtención de imagen
- Segmentación
- Pre procesamiento
- Extracción de características
- Clasificación
-
Obtención de imagen
Existen dos tipos de Sistemas OCR, según su forma de procesamiento:
- Offline
- Online
Cada alternativa manejara tipos de datos distintos y por ende modificará el tipo de procesamiento de las entradas mencionadas.
2. Segmentación
Etapa en que se busca extraer cada carácter de una linea de texto.
3. Pre procesamiento
- Esta etapa sirve el propósito de mejorar, limpiar y normalizar la imagen para que la siguiente etapa pueda realizar su tarea de forma eficaz y eficiente.
- Al final de esta etapa se tendrá una sub imagen de dimensionalidad y ruido reducidos.
4. Extracción de características
- En esta etapa se busca obtener los valores de ciertas características predefinidas que permiten identificar patrones
- Para elegirlas se debe tener presente que las características de distintas instancias de una clase deben seguir un patrón, mientras que las características de clases distintas deben ser lo suficientemente distintas para poder diferenciarlas
4.1 Geométricas
Las características que incluyen son:
- Momentos: extraen propiedades globales como la figura, tales como el area de la figura o el centro de la masa.
- Histogramas: muestran la distribución de un conjunto de pixeles en una imagen en escala de grises.
- Dirección: analizan la dirección de los trazos que componen el caracter.
4.2 Estructurales
Las características estructurales incluyen:
- Descriptores de fourier: representan la morfología de la figura en el dominio de las frecuencias. Permiten discriminar y normalizar con facilidad, tienen una gran tolerancia al ruido y buena preservación de la información.
- Aproximación: aproximan a la figura a segmentos, polilineas y curvas, para tratar con información vectorial.
- Topologías: extraen información del esqueleto o del contorno del caracter, como puntos relevantes (cruces, extremos, diversificaciones) o la aproximación de sus curvas
5. Clasificación
Asociar el conjunto de datos obtenido en la etapa de extracción de características de un carácter a una clase en particular.
- Métodos Estadísticos: estiman la probabilidad de que un elemento pertenezca a una clase.
- Métodos Estructurales: comparan contra una plantilla una estructura de longitud variable que contiene la secuencia de los trazos o la forma del carácter.
- Redes neuronales: asidua mente utilizadas para resolver problemas de reconocimiento de patrones.
- Multi clasificadores: combinación de múltiples clasificadores para aprovechar las fortalezas de cada uno.
Redes Neuronales
Introducción
- Constituyen una modelización del cerebro
- Sistemas entrenados
- Reconocimiento de caracteres.
Estructura
Ejemplo
Memoria Asociativa
Memoria Asociativa
Memoria Asociativa
Memoria Asociativa
Ejemplo
Capacidad de la memoria asociativa:
Con N neuronas podemos guardar N patrones
Gracias
Reconocimiento de Caracteres utilizando redes neuronales
By Paul Mesco Sota
Reconocimiento de Caracteres utilizando redes neuronales
- 599