Visión artificial

A visión artificial ou visión por computador é un campo interdisciplinario que trata de entender como se pode facer que os ordenadores sexan capaces entender a información de alto nivel que de vídeos ou imaxes dixitais. Dende a perspectiva de enxeñaría, esta trata de replicar o que o sistema visual humano pode facer.[1][2][3]

Entre as numerosas tarefas da visión do computador inclúense métodos para adquirir, procesar, analizar e entender imaxes dixitais, e extracción de datos dunha gran cantidade de dimensións dende o mundo real para transformalos información numérica ou simbólica, e.g., en forma de decisións.[4][5][6][7] Entender neste contexto significa a transformación de imaxes visuais (a entrada da retina) a descricións do mundo que pode entrelazarse con outros conceptos e obter a acción apropiada. Entender unha imaxe entón, pode ser visto como a extracción de información simbólica da imaxe utilizando modelos construídos coa axuda da xeometría, da física, da estatística, e da teoría da aprendizaxe.[8]

Como disciplina científica, a visión artificial ocúpase da teoría detrás dos sistemas artificiais que extraen información das imaxes. Unha imaxe pode tomar moitas formas, como secuencias de vídeo, vistas desde cámaras múltiples, ou imaxes multi-dimensionais dende un escáner médico. Como disciplina tecnolóxica, a visión artifical busca para aplicar as súas teorías e modelos para a construción de sistemas de visión do computador.

Entre algúns dos campos dentro da visión artificial atopamos a reconstrución de escenas, detección de acontecemento, seguimento de vídeo, recoñecemento de obxectos, 3D estimación de pose, aprendizaxe, estimación de movemento, e restauración de imaxe.[6]

Historia

editar

A finais dos anos 1960, a visión artificial empezou en universidades pioneiras na intelixencia artificial. A idea era imitar o sistema visual humano para dar un o primeiro paso cara a creación de robots cun comportamento intelixente. En 1966, críase que isto podería ser acadado por un proxecto de verán, simplemente conectando unha cámara a un ordenador e facerlle "describir o que viu".[9][10]

Naquel tempo, o que distinguía a visión artificial do prominente campo do procesamento de imaxe dixital  era un desexo de extraer a estrutura tridimensional a partir de imaxes co obxectivo de conseguir entender de toda a escenas. Algúns estudos nos anos 1970s comezaron a definir algúns dos conceptos  básicos para moitos dos algoritmos de visión artificial que existen hoxe, incluíndo extracción de bordos de imaxes, marcaxe de liñas, a modelaxe poliédrica e non poliedrica, a representación de obxectos como interconexións de estruturas máis pequenas, fluxo óptico, e a estimación de movemento.[11]

Na década seguinte atopamos estudos baseados nunha análise matemática moito máis rigorosa e nos aspectos cuantitativos da visión por computador. Estes inclúen o concepto de escala-espazo, a influencia da forma dende varios puntos de vista como o sombreado, a textura e o enfoque, e modelos de contorno coñecidos como serpes (snakes). Os investigadores tamén se decataron de que moitos destes conceptos matemáticos poderían ser tratados no mesmo cadro da optimización como regularización e os campos aleatorios de Markov.[7] Nos anos 1990, a investigación en reconstrucións 3D proxectivas captaron o interese dos investigadores e leváronnos a entender mellor a calibración das cámaras.  Isto desembocou en métodos para 3-D reconstrucións de escenas desde imaxes múltiples.  Esta década tamén representa tamén o nacemento das técnicas aprendizaxe estatística que foron utilizadas na práctica para recoñecer caras en imaxes (ver Eigenface).

Aplicacións

editar

A gama de aplicacións da visión artificial van desde tarefas como sistemas de visión máquina industriais que, por exemplo, detectan defectos nunha liña de produción, a investigación en intelixencia artificial ou a creación de robots capaces de entender o mundo visual. A visión por computador e os campos de visión máquina están intimamente relacionados. A visión por computador cobre a tecnoloxía de base usada na análise de imaxes automatizada e é utilizada en moitos campos. A visión máquina normalmente refírese a un proceso de combinar análise de imaxe automatizada con outros métodos e tecnoloxías para realizar unha inspección automatizada aplicacións industriais. En moitas aplicacións de visión por computador, os computadores están programados para solucionar unha tarefa particular, non obstante os métodos baseados na aprendizaxe son cada vez máis comúns. Exemplos das aplicacións de visión de computador inclúen sistemas para:

 
Aprendizaxe 3D as formas foi unha tarefa desafiante en visión por computador. Os avances recentes en aprendizaxe profunda habilitou aos investigadores para construír modelos que son capaces de xerar e reconstruír formas 3D dende unha ou varias vistas eficientemente.
  • Inspección automática, e.g., na industria da manufactura.
  • Asistencia a humanos en tarefas de identificación, e.g., un sistema de identificación da especie.[12]
  • Detección procesos, e.g., un robot industrial.
  • Detección de eventos, e.g., vídeo-vixianza ou contadores de persoas.
  • Interacción, e.g., como entrada a un dispositivo para a interacción ordenador-humana.
  • Modelaxe de obxectos ou ambientes, e.g., análise de imaxe médica.
  • Navegación, e.g., vehículos autónomos ou robot móbil.
  • Información organizadora, e.g., para indexar bases de datos de imaxes e secuencias de imaxe.
  1. 1946-, Ballard, Dana H. (Dana Harry), (1982). Computer vision. Englewood Cliffs, N.J.: Prentice-Hall. ISBN 0-13-165316-4. OCLC 7978044. 
  2. Proceedings : 1996 CERN School of Computing : Egmond aan Zee, the Netherlands, 8 September-21 September 1996. Geneva: CERN. 1996. ISBN 978-9290830955. OCLC 36583267. 
  3. Milan., Sonka, (2008). Image processing, analysis, and machine vision (3rd ed ed.). Toronto: Thompson Learning. ISBN 0-495-08252-X. OCLC 123776599. 
  4. Reinhard,, Klette,. Concise computer vision : an introduction into theory and algorithms. London. ISBN 978-1-4471-6320-6. OCLC 869222487. 
  5. G., Shapiro, Linda (2001). Computer vision. Upper Saddle River, NJ: Prentice Hall. ISBN 0-13-030796-3. OCLC 45393572. 
  6. 6,0 6,1 1960-, Morris, Tim, (2004). Computer vision and image processing. Basingstoke: Palgrave Macmillan. ISBN 0-333-99451-5. OCLC 52486158. 
  7. 7,0 7,1 David., Forsyth, (2003). Computer vision : a modern approach. Upper Saddle River, N.J.: Prentice Hall. ISBN 0-13-085198-1. OCLC 50100728. 
  8. David., Forsyth, (2003). Computer vision : a modern approach. Upper Saddle River, N.J.: Prentice Hall. ISBN 0-13-085198-1. OCLC 50100728. 
  9. A., Papert, Seymour (1966-07-01). "The Summer Vision Project" (en inglés). 
  10. A., Boden, Margaret (2008, ©2006). Mind as machine : a history of cognitive science ([1st paperback ed.] ed.). Oxford: Clarendon Press. ISBN 978-0-19-954316-8. OCLC 370242127. 
  11. 1958-, Szeliski, Richard, (2011). Computer vision : algorithms and applications. London: Springer. ISBN 978-1-84882-935-0. OCLC 682910466. 
  12. Johnson, B. M. (1975-11). "The use of radioactive microspheres to compare the effects of hydralazine, guanethidine and SK & F 24260 on the redistribution of cardiac output in anaesthetized rabbits". British Journal of Pharmacology 55 (3): 393–402. ISSN 1134-3060. PMID 1134.