¿Qué es?
La visión por computadora es una rama de la inteligencia artificial que tiene por objetivo modelar matemáticamente los procesos de percepción visual en los seres vivos y generar programas que permitan simular estas capacidades visuales por computadora.
Terminología
El proceso de visión por computadora puede subdividirse en seis áreas principales:
1. Sensado: Es el proceso que nos lleva a la obtención de una imagen visual
2. Preprocesamiento: Trata de las técnicas de reducción de ruido y enriquecimiento de los detalles en la imagen
3. Segmentación: Es el proceso que particiona una imagen en objetos de interés.
4. Descripción: Trata con el cómputo de características útiles para diferenciar un tipo de objeto de otro.
5. Reconocimiento: Es el proceso que identifica esos objetos.
6. Interpretación: Asigna un significado a un conjunto de objetos reconocidos.
Conceptos Fundamentales
¿Y tu cómo ves?
La luz (energía electromagnética) incide en el ojo y es transformada en impulsos nerviosos por la retina.
Text
Para ello, la retina posee dos tipos de células especializadas en captar la luz (foto-receptores): los conos y los bastones.
Los impulsos nerviosos son transmitidos al cerebro a través de los nervios ópticos.
Finalmente, el córtex visual del cerebro (junto a otras áreas) da forma y sentido a la imagen.
Conos y bastones
Los conos son células sensibles a los colores. Esta sensibilidad es debida a unas moléculas presentes en los conos llamadas opsinas.
Hay tres tipos de conos, cada uno de ellos sensible a una longitud de onda (color) distinto: rojo, verde y azul.
Los bastones son células sensibles a la intensidad de luz (el brillo).
Text
+
+
¿Y las máquinas cómo ven?
Ven a través de cámaras conectadas a ellas. Estas cámaras pueden tomar fotografías (una imagen) o animaciones (secuencia de imágenes, vídeo).
Las imágenes son tratadas y procesadas para convertirlas en nuevas imágenes con mejor información: procesamiento de imágenes.
A continuación, se usa la información contenida en las imágenes procesadas para resolver un problema del mundo real: análisis de imágenes.
Procesamiento de imágenes
Tiene como objetivo mejorar la calidad de las imágenes para su posterior utilización o interpretación.
Etapas
1. Captura: Diseño de las propiedades de la captura. Tipo de cámara, distancia al objeto, mega píxeles, etc.
2. Pre-procesamiento: Reducir el entorno que no es de interés para el problema. Fondo, ruido, etc.
3. Segmentación: Reconocer y extraer cada uno de los objetos presentes en la imagen.
4. Extracción de características: Seleccionar y extraer “características” apropiadas para la identificación de los objetos deseados.
5. Identificación de objetos: Utilizar un modelo de toma de decisión para decidir a que categoría pertenece cada objeto.
Análisis de Imágenes
Se llama análisis de imágenes a la extracción de información derivada de sensores y representada gráficamente en formato de dos o tres dimensiones, para lo cual se puede utilizar tanto análisis visual como digital.
Aplicaciones
Muchas cámaras digitales registran la luz mediante unos semiconductores (materiales que pueden conducir la electricidad o no, en situaciones controlables) llamados photosites, en función de la componente roja, verde y azul de la luz. Este formato se llama RGB (Red, Green, Blue).
Las máquinas pueden usar cámaras que ven tipos de luz que no pueden ver los humanos: ultravioleta, infrarroja, rayos X, …
Aplicaciones
Referencias