Reconocimiento de caracteres utilizando redes neuronales

Universidad Nacional Jorge Basadre Grohmann

 

 

Dennis Juan Calluhuari Mamani   2009-34084

Paul Lionel Mesco Sota                  2010-35541

Los sistemas de reconocimiento optico de caracteres

  • Principio de los años 50
  • Los primero sistemas OCR no eran capaces de reconocer caracteres o palabras manuscritos puesto que su metodología de reconocimiento no era lo suficientemente sofisticada
  • Actualmente, los sistemas OCR son muy poderosos y complejos llegando a niveles de reconocimiento muy altos, en especial en el procesamiento de textos impresos.

Procesamiento

  1. Obtención de imagen
  2. Segmentación
  3. Pre procesamiento
  4. Extracción de características
  5. Clasificación
  1. Obtención de imagen

Existen dos tipos de Sistemas OCR, según su forma de procesamiento:

  • Offline
  • Online

 

Cada alternativa manejara tipos de datos distintos y por ende modificará el tipo de procesamiento de las entradas mencionadas.

2.   Segmentación

Etapa en que se busca extraer cada carácter de una linea de texto.

3. Pre procesamiento

  • Esta etapa sirve el propósito de mejorar, limpiar y normalizar la imagen para que la siguiente etapa pueda realizar su tarea de forma eficaz y eficiente.
  • Al final de esta etapa se tendrá una sub imagen de dimensionalidad y ruido reducidos.

4.  Extracción de características

  • En esta etapa se busca obtener los valores de ciertas características predefinidas que permiten identificar patrones
  • Para elegirlas se debe tener presente que las características de distintas instancias de una clase deben seguir un patrón, mientras que las características  de clases distintas deben ser lo suficientemente distintas para poder diferenciarlas

4.1 Geométricas

Las características que incluyen son:

  • Momentos: extraen propiedades globales como la figura, tales como el area de la figura o el centro de la masa.
  • Histogramas: muestran la distribución  de un conjunto  de pixeles en una imagen en escala de grises. 
  • Dirección: analizan  la dirección de los trazos que componen el caracter.

4.2 Estructurales

Las características estructurales incluyen:

  • Descriptores de fourier: representan la morfología de la figura en el dominio de las frecuencias. Permiten discriminar y normalizar con facilidad, tienen una gran tolerancia al ruido y buena preservación de la información.
  • Aproximación: aproximan a la figura a segmentos, polilineas y curvas, para tratar con información vectorial.
  • Topologías: extraen información del esqueleto o del contorno del caracter, como puntos relevantes (cruces, extremos, diversificaciones) o la aproximación de sus curvas

5. Clasificación

Asociar el conjunto de datos obtenido en la etapa de extracción de características de un carácter a una clase en particular.

  • Métodos Estadísticos: estiman la probabilidad de que un elemento pertenezca a una clase.
  • Métodos Estructurales: comparan contra una plantilla una estructura de longitud variable que contiene la secuencia de los trazos o la forma del carácter.
  • Redes neuronales:  asidua mente utilizadas para resolver problemas de reconocimiento de patrones.
  • Multi clasificadores: combinación de múltiples clasificadores para aprovechar las fortalezas de cada uno.

Redes Neuronales

Introducción

  • Constituyen una modelización del cerebro
  • Sistemas entrenados
  • Reconocimiento de caracteres.

Estructura

Ejemplo

Memoria Asociativa

Memoria Asociativa

Memoria Asociativa

Memoria Asociativa

Ejemplo

Capacidad de la memoria asociativa:

Con N neuronas podemos guardar N patrones

Gracias

Made with Slides.com