CAPITULO I 1.1. PLANTEAMIENTO DEL PROBLEMA En la actualidad el crecimiento de la tecnología ha traído un gran beneficio a las personas como consecuencia tenemos que la vida de las personas se volvió mas fácil haciéndolas cada vez mas dependientes de los productos electrónicos tal como es el caso del uso de la vision artificial. Este es usado en grandes empresas para el control de los productos que este tiene, y también es usado por personas individuales como es el caso de las cámaras del propio celular, al momento de sacar una foto o un video y enviarla a otra persona estamos haciendo uso de la vision artificial. Es por eso que nos planteamos la siguiente pregunta: ¿Cómo podría un sistema de visión artificial ayudar a las personas para realizar una actividad o facilitar su forma de vida realizando alguna tarea?
1.2. JUSTIFICACIÓN El sentido de la vista es muy importante para una persona en la comunicación e interactuación con el medio, ya sea usado para la ubicación del lugar, control y conteo en un fabrica o reconocimiento de células como es en el caso de la medicina. Es por eso que el uso de la vision artificia es muy importante y beneficioso para las personas. Un programa o sistema de visión artificial es muy útil ayudando a las personas a realizar una actividad es por eso su importancia de implementación en un área de trabajo.
1.3. OBJETIVO GENERAL Para lograr estos objetivos se debe hacer un reconocimiento de patrones, geometría de proyección, y procesamiento de imágenes, teoría de grafos y otros. 1
La detección, segmentación, localización y reconocimiento de ciertos objetos en imágenes (como caras humanas).
La evaluación de los resultados como segmentación y registro.
Registro de diferentes imágenes de una misma escena u objeto, es decir, hacer concordar un mismo objeto en diversas imágenes.
Seguimiento de un objeto en una secuencia de imágenes.
Mapeo de una escena para generar un modelo tridimensional de la escena; este modelo podría ser usado por un robot para navegar por la escena.
Estimación de las posturas tridimensionales de humanos.
Búsqueda de imágenes digitales por su contenido.
2
CAPITULO II MARCO TEORICO Y CONCEPTUAL 2.1. DEFINICION DE VISION Se llama visión a la capacidad de interpretar nuestro entorno gracias a los rayos de luz que alcanzan el ojo. También se entiende por visión toda acción de ver. La visión o sentido de la vista es una de las principales capacidades sensoriales de los humanos y de muchos otros animales. Existen diferentes tipos de métodos para el examen de la visión. Algunas definiciones que podemos dar de lo que es visión es: Aristóteles: \visión es saber que hay y donde mediante la vista". Gibsona: \visión es recuperar de la información de los sentidos (vista) propiedades validas del mundo exterior." Marrb: "visión es un proceso que produce, a partir de las imágenes del mundo exterior, una descripción que es útil para el observador y que no tiene información irrelevante."
2.2. DEFINICION DE VISION ARTIFICIAL La definición de Marr es la que mejor describe el concepto de visión artificial en tres aspectos importantes: 1.- La visión es un proceso computacional. 2.- La descripción a obtener depende del observador. 3.- Reducción de información: es necesario eliminar la información que no sea útil. Es un campo de la “Inteligencia Artificial” que, mediante la utilización de las técnicas adecuadas, permite la obtención,
procesamiento y análisis de cualquier tipo de
información especial obtenida a través de imágenes digitales. Describe la detección automática de la estructura y propiedades de un posible mundo dinámico en 3 dimensiones a partir una o varias imágenes bidimensionales del mundo.
3
Las imágenes pueden ser monocromáticas o a color, pueden ser capturadas por una o varias cámaras, y cada cámara puede ser estacionaria o móvil. La estructura y propiedades del mundo tridimensional que se intentan deducir en la visión artificial incluyen no sólo propiedades geométricas, sino también propiedades del material y la luminosidad. Ejemplos de propiedades geométricas: tamaños, formas y localización de objetos. Ejemplos de propiedades de los materiales: luminosidad u oscuridad de las superficies, sus colores, sus texturas y la composición de los materiales. La visión artificial la componen un conjunto de procesos destinados a realizar el análisis de imágenes. Estos procesos son: captación de imágenes, memorización de la información, procesado e interpretación de los resultados.
2.3. APLICACIONES DE LA VISION ARTIFICIAL Con la visión artificial se pueden:
Identificación
Identificación biométrica: huellas, pisadas, firmas, iris...
Reconocimiento de caras, de gestos
Control de tráfico
Reconocimiento de matrículas, peaje por volumen, control de flujo
Sistemas de ayuda a la conducción
Guiado de robots industriales, vehículos autónomos
Análisis de imágenes por satélite
Aplicaciones militares: detección de objetivos, guiado balístico...
Bioingeniería: ayuda al diagnóstico
2.3.1. INSPECCIÓN INDUSTRIAL Y CONTROL DE CALIDAD Hoy en día, en muchos procesos de fabricación, los límites de detección de defectos han superado la percepción del ojo humano; por esta razón las empresas del mundo 4
moderno han visto la necesidad de crear un sistema que permita controlar en forma precisa y acertada la calidad de sus productos. Cuando el parámetro relevante es la geometría o forma del objeto fabricado se suele dejar a la vista del operario que lleve a cabo tal función tanto de inspección como de verificación para el control de calidad, sin embargo pueden existir errores en la geometría de un objeto que escapen de la vista de un operario y que luego impidan el buen funcionamiento de dicho objeto. En un caso como éste, surge como una buena alternativa el utilizar un sistema de visión artificial capaz de detectar aquellos errores que un operario pudiera pasar por alto. 2.3.2. DETECCIÓN DE DEFECTOS. ELEMENTOS DISCRETOS La detección de defectos puede ser considerada como un caso especial de control de la conformidad, en el que los objetos no ofrecen formas especificas caracterizables. Como ejemplos, citaremos la inspección de baldosas cerámicas en la etapa previa al esmaltado para detectar defectos en la superficie como rugosidades, o el uso de infrarrojos para la inspección de defectos de botellas de vidrio. 2.3.3. DETECCIÓN DE DEFECTOS. TEJIDOS O LAMINADOS La característica de muchos sistemas de este tipo es que se debe examinar grandes áreas a gran velocidad, en busca de defectos relativamente pequeños. El material producido en bobinas incluye la chapa de acero, papel, películas fotográficas, vidrio, hoja de plástico y los textiles. Algunos de estos sistemas utilizan el escaneado láser en lugar de cámaras lineales para formar la imagen. 2.4.
ESTRUCTURA DEL SOFTWARE
En la siguiente figura se indica la estructura implementada en el software de visión artificial, este diagrama se explica desde arriba hacia abajo, en esta se dice que existen tres perfiles de usuario: Básico, intermedio y avanzado.
5
Figura. 1 estructura del software 2.5.
ESTRUCTURA DEL CAMPO VISUAL
Esto hace referencia a la imagen plana que refleja una escena generalmente tridimensional, para esto se han usado sensores foveales los cuales presentan un perfil de resolución variable a lo largo del campo de visión. Al realizar esto permite que la percepción y al ambiente visual en el que estamos trabajando sean coordinados y que se dé una mejor interacción, gracias a esto podremos recibir las imágenes más detalladas pero sin perder de vista el campo visual en que estamos [6]. De la misma manera podemos aplicar esto para detectar el densidad de peatonal en tiempo real, de esta manera podremos detectar aumenta densidad de personas en ciertas horas del día y sin la necesidad de que alguna persona este sentado todo el día enfrente de una cámara de vigilancia para realizar todo esto se presenta el siguiente diagrama de bloque detallando cada una de las etapas [8]:
6
Figura 2 2.6.
DETECCIÓN DE OBJETOS EN MOVIMIENTO
Cunado un objeto está en movimiento estos producen cambios de intensidad debido a los reflejos producidos por la luz, eso significa que si analizamos dos imágenes sucesivamente esto producirán cambios de intensidad tanto en objetos móviles como estáticos [8][9].
7
También presentamos una propuesta para el reconocimiento invariante de objetos que está basada en el uso de formas cónicas dentro de la base más simple de conocimiento, esto se puede representar mediante un vector que se llama CDF&POSE. Generación del vector descriptivo [CDF&POSE]: Cuando la información ya ha sido procesada se conforma el vector descriptivo que en realidad es la entrada a la red neuronal.
1. Detección de movimiento invariante a la luz:
8
Figura 3
3. Clasificación
Figura 4
9
2.7. COMO FUNCIONA LA VISION ARTIFICIAL
Figura 5 Aunque cada aplicación de visión artificial tiene sus especificidades, se puede decir que existe un tronco común de etapas entre ellas. No necesariamente debe cubrirse todas en una implementación concreta. Hay algunas veces que sólo se tiene un subconjunto de las fases que se van a citar. Por otro lado, aunque la exposición muestra un encadenamiento temporal de una etapa sobre otra, no es real esta simplificación; se hace para facilitar la comprensión y en la puesta en práctica siempre se encuentra realimentación entre las distintas fases. Los dos pilares del sistema físico de visión artificial son: el sistema de formación de las imágenes y el sistema de procesamiento de éstas. En el primer apartado estaría constituido por el subsistema de iluminación, de captación de la imagen y de adquisición de la señal en el computador. Una vez introducida la señal en el computador, ésta es procesada mediante los algoritmos para transformarla en información de alto nivel. La cual puede ser utilizada para su representación visual, para actuar en el planificador de un robot o ser fuente de datos para un autómata programable. En definitiva, múltiples periféricos pueden ser receptores de esta información y vincularse con el sistema de procesamiento de las imágenes.
10
Figura 6
2.8. ETAPAS DE UN SISTEMA DE VISION ARTIFICIAL 2.8.1. ADQUISICIÓN DE LA IMAGEN La primera etapa es la construcción del sistema de formación de las imágenes. Su objetivo es realzar, mediante técnicas fotográficas (iluminación, óptica, cámaras, filtros, pantallas), las características visuales de los objetos (formas, texturas, colores, sombras). El éxito de muchas aplicaciones depende de un buen diseño en esta primera etapa. 2.8.2. PREPROCESADO Una vez adquirida la imagen se pasará a la etapa de preprocesado. El objetivo es mejorar la calidad informativa de la imagen adquirida. Se incluyen operaciones de mejora de la relación señal-ruido (denoising), SNR, de atenuar las imperfecciones de la adquisición debido a la función de transferencia del sistema de captación de 11
imágenes (deconvolution), de regularizar la imagen, de mejorar el contraste o de optimizar la distribución de la intensidad (enhancement) o de realzar algunas características de la imagen, como bordes o áreas. 2.8.3. SEGMENTACIÓN En esta fase se divide la imagen en áreas con significado. Se trata de decidir qué partes de la imagen necesitan interpretación o análisis y cuáles no. A menudo es posible y necesario refinar la segmentación. Por ejemplo, si la aplicación debe encontrar arañazos o grietas en un vidrio, la primera fase de segmentación suele encontrar elementos que son las propias grietas o arañazos además de suciedad y polvo. Otro ejemplo, en una imagen de satélite se determina las zonas de agua, de cultivo, urbanas, carreteras. A menudo se perfecciona este resultado para eliminar de la imagen la suciedad y el polvo de los elementos a analizar. Existen varias técnicas: umbralizaciones, discontinuidades, crecimiento de regiones, uso del color o de movimiento, etc. 2.8.4.
REPRESENTACIÓN
Y
DESCRIPCIÓN
(EXTRACCIÓN
DE
CARACTERÍSTICAS) Una vez dividida la imagen en zonas con características de más alto nivel se pasará a su extracción de las características. Básicamente son de tipo morfológico, tales como área, perímetro, excentricidad, momentos de inercia, esqueletos, pero también se puede emplear características basadas en la textura o en el color. Fíjese que se ha pasado de una información visual primaria a algo más elaborado. Con las características analizadas ahora cada región se debe de clasificar e interpretar. Por tanto, se diseñarán clasificadores que le dé a cada área segmentada una etiqueta de alto nivel, como por ejemplo, en una imagen aérea qué zonas son tierras de cultivo, áreas urbanas, etc. Existe un elenco de técnicas de clasificación, como redes neuronales, sistemas expertos, lógica difusa, clasificadores estadísticos, etc. 12
2.8.5. RECONOCIMIENTO E INTERPRETACIÓN Una vez que la imagen ha sido satisfactoriamente segmentada y han sido extraídas las características, el procesador puede hacer una serie de pruebas y mediciones en los elementos de interés que aparecen en la escena. Existen multitud de algoritmos que nos ayudan a obtener los resultados deseados. Entre ellos, cabe destacar sus funcionalidades:
Detección de formas
Análisis geométrico
Comparación con patrones
Medición de objetos
Detección de objetos difusos
Estos algoritmos, usados estratégicamente, nos permiten decidir si una pieza se ha fabricado correctamente o no, guiar un robot hacia un objeto concreto o reajustar la maquinaria de producción automáticamente.
2.9. DIFICULTADES DE LA VISION ARTIFICIAL Las dificultades que se presentan al momento de querer emplear la visión artificial son varias desde la deformación de la imagen hasta su pérdida de información, algunas de las dificultades son:
Imagen del mundo 3D Imágenes 2D. Proyección =Pérdida de Información
Carácter dinámico de muchas escenas.
Selección de zonas de interés.
Adaptación a condiciones de iluminación cambiantes.
Los datos visuales (imágenes) contienen información “codificada” junto a bastante información “superflua”, pero no la información invariante que nos permite a los seres vivos reconocer objetos. 13
Cambios de escala
Deformación
Oclusión
Movimiento
14
CAPITULO III CONCLUSIONES Y BIBLIOGRAFIA 3.1. CONCLUSIONES Podemos concluir que la importancia que tiene la visión artificial que es una parte que abarca la inteligencia artificial, es que podemos crear mecanismos que realicen trabajo no por el simple hecho de recibir órdenes si no que son capaces de visualizar su objetivo, tomar decisiones y ejecutarlas, como por ejemplo aplicada en la detección de peatones, esta es una nueva tecnología que aun se esta desarrollando en proyectos grandes, por el momento es usado para la medicina, en la industria y como control peatonal.
3.2. BIBLIOGRAFIA
SARI OSCAR, Visión Artificial (2004) http://www.monografias.com/trabajos93/vision-artificial/visionartificial.shtml#introducca ,26 de marzo 2017
SALGADO LUIS, Fundamentos de vision artificial (2007) http://arantxa.ii.uam.es/~jms/seminarios_doctorado/abstracts20062007/20070503LSalagado.pdf,26 de marzo 2017
Vision artificial e interaccion sin mandos (2010) http://sabia.tic.udc.es/gc/Contenidos%20adicionales/trabajos/3D/VisionArtificial/, 26 de marzo 2017
NIZ SERGIO, Inteligencia artificial (2014) https://es.slideshare.net/eliponzoni/visin-artificial-original, 26 de marzo 2017
15