-
Primera Fotografía
El químico francés Niepce (1765-1833) llevó a cabo la primera fotografía, colocando una superficie fotosensible dentro de una cámara oscura para fijar la imagen. -
Primer proceso fotográfico
El químico francés Daguerre (1787-1851) hizo el primer proceso fotográfico. Utilizando una placa fotográfica que era revelada con vapor de mercurio y fijada con trisulfato de sodio. -
Sistemas que pudieran "Ver"
En la conferencia de Dartmouth, se establece formalmente el campo de la inteligencia artificial (IA). Aunque la visión artificial no era el foco principal, este evento sentó las bases para el desarrollo de sistemas que pudieran "ver" y comprender imágenes. -
Primer escáner de imágenes digitales
El grupo de Kirsch desarrolló un escáner de imágenes digitales para "rastrear variaciones de intensidad sobre las superficies de las fotografías" e hizo los primeros escaneos digitales. Una de las primeras fotografías escaneadas, una imagen del hijo de tres meses de Kirsch, fue capturada con solo 30.976 píxeles , una matriz de 176 × 176, en un área de 5 cm × 5 cm (2" x 2"). -
Experimento del gato de Hubel y Wiesel
El experimento del gato de Hubel y Wiesel fue una serie de investigaciones que permitieron descubrir cómo se desarrolla el sistema visual en los mamíferos. Los científicos David Hubel y Torsten Wiesel estudiaron la actividad eléctrica de las neuronas en la corteza visual de los gatos. -
Método para interpretar información tridimensional de imágenes bidimensionales
Larry Roberts, considerado el padre de la visión por computadora, publica su tesis doctoral titulada "Machine Perception of Three-Dimensional Solids". Este trabajo sentó las bases para el procesamiento de imágenes 3D. -
Proyecto Summer Vision
El proyecto de visión de verano es un intento de utilizar a nuestros trabajadores de verano de forma eficaz en la construcción de una parte importante de un sistema visual. Aunque el proyecto fue ambicioso y no logró sus objetivos a corto plazo, marcó el inicio de la investigación en visión artificial. -
Avances en procesamiento de imágenes
Se desarrollan los primeros algoritmos para la detección de bordes y la segmentación de imágenes, técnicas fundamentales en visión artificial. -
Articulo: "Vision: A Computational Investigation"
David Marr, un neurocientífico británico, publicó otro artículo influyente: " Visión: una investigación computacional sobre la representación humana y el procesamiento de la información visual ".
David nos dio la siguiente idea importante: estableció que la visión es jerárquica. La función principal del sistema de visión, argumentó, es crear representaciones en 3D del entorno para que podamos interactuar con él. -
Algoritmo backpropagation
David Rumelhart, Geoffrey Hinton y Ronald Williams popularizan el algoritmo de backpropagation, que permite entrenar redes neuronales de manera eficiente. Este avance es crucial para el desarrollo de sistemas de visión artificial basados en aprendizaje profundo. -
MNIST dataset
Se crea el MNIST dataset, un conjunto de datos de dígitos escritos a mano que se convierte en un estándar para probar algoritmos de reconocimiento de imágenes. -
Face Detection
Se desarrollan los primeros algoritmos eficientes para la detección de rostros en imágenes, lo que abre la puerta a aplicaciones como el reconocimiento facial. -
Object Recognition from Local Scale-Invariant Features
El trabajo de David Lowe " Reconocimiento de objetos a partir de características locales invariantes a escala " fue particularmente indicativo de esto.
El artículo describe un sistema de reconocimiento visual que usa características locales que son invariantes a la rotación, ubicación y, parcialmente, cambios en la iluminación. -
Primer marco de detección de rostros
Paul Viola y Michael Jones introdujeron el primer marco de detección de rostros que funcionaba en tiempo real. Aunque no se basa en el aprendizaje profundo, el algoritmo todavía tenía un sabor de aprendizaje profundo, ya que, mientras procesaba imágenes, aprendió qué características (características muy simples, similares a las de Haar ) podrían ayudar a localizar rostros. -
Pascal VOC
El formato Pascal VOC (Visual Object Classes) es uno de los primeros puntos de referencia establecidos para la clasificación y detección de objetos, que proporciona un conjunto de datos de imágenes estandarizados para el reconocimiento de clases de objetos.
El formato de datos de exportación se basa en XML y ha sido ampliamente adoptado en tareas de visión artificial. -
ImageNet
Se lanza el ImageNet dataset, una base de datos masiva de imágenes etiquetadas que se convierte en un estándar para entrenar y evaluar algoritmos de visión por computadora. -
Alex Net
AlexNet, una red neuronal convolucional desarrollada por Alex Krizhevsky, gana la competencia ImageNet Large Scale Visual Recognition Challenge (ILSVRC). Este evento marca el inicio de la era moderna de la visión artificial basada en aprendizaje profundo. -
Generative Adversarial Networks (GANs)
Se trata de un sistema de aprendizaje automático (machine learning) desarrollado en 2014 por un equipo dirigido por Ian Goodfellow. El propósito de una Generative Adversarial Network es crear diseños propios basados en un conjunto de datos reales. El resultado es tan engañosamente real que es imposible saber que la imagen no proviene de una mano humana. Para conseguir estos resultados, se utilizan dos redes neuronales que compiten entre ellas. -
ResNet
ResNet es un algoritmo de aprendizaje profundo que clasifica imágenes. Es un modelo de red neuronal residual que utiliza conexiones de salto para mejorar el entrenamiento de redes neuronales profundas. -
DALL-E y CLIP
OpenAI ha usado GPT-3 para crear dos nuevos modelos que combinan procesamiento del lenguaje natural con reconocimiento de imágenes. Gracias a esta mezcla, son capaces de identificar objetos que no han visto y de crear imágenes a partir de nuevas descripciones de texto -
Period: to
Aplicaciones en tiempo real
La visión artificial se integra en aplicaciones cotidianas, como asistentes virtuales, vehículos autónomos, sistemas de seguridad y diagnósticos médicos. -
2024 y más
Se espera que la visión artificial continúe avanzando con modelos más eficientes, interpretables y capaces de comprender el contexto visual de manera similar a los humanos. Además, se exploran aplicaciones en realidad aumentada, robótica avanzada y interacción humano-máquina.