Timeline: Historia del Reconocimiento Digital de la Voz

1668

Primeros Intentos de Producción

1779

Christian Gottlieb Kratzenstein

Científico Danés, construyó modelos del tracto vocal que podría producir las cinco vocales largas (a, e, i, o, u).

1870

Alexander Graham Bell

Quiso desarrollar un dispositivo capaz de proporcionar la palabra visible para la gente que no escuchara. Bell no tuvo éxito creando este dispositivo, sin embargo, el esfuerzo de esta investigación condujo al desarrollo del teléfono. Inicio del Reconocimiento de la Voz

1879

WH Preece y A. Stroh

Examinaron bajo microscopio las estrías producidas por el gramófono. Intentan descubrir la Naturaleza Física de los sonidos

1940

ARTEFACTOS QUE RECONOCEN LA VOZ

Los laboratorios de AT & T y Bell desarrollaron artefactos primitivos que podían reconocer la voz. Éstos científicos sabían que el éxito y la globalización de esta tecnología iba a depender de su habilidad de percibir Información verbal COMPLEJA, con alta precisión.

1950

MODELADOR DE TRACTO VOCAL

Se creo un modelador de tracto vocal y se lograba un gran mejora de los resultados con respecto a los proporcionados por el Voder.

1950

Aplicaciones de la modulación de la Voz

Comenzaron a realizar aplicaciones con vocabularios pequeños,dependientes del locutor y con palabras de flujo discreto

1952

Primer sistema de reconocimiento de voz

EL primer sistema de reconocimiento de voz fue desarrollado en 1952 sobre una computadora analógica que reconocía dígitos del 0 al 9,este sistema era dependiente del locutor

1960

DEPENDIENTES DEL LOCUTOR

Dependientes de locutor. Flujo discreto de habla,( con espacios/ pausa entre palabras). Vocabulario pequeño ( menor o igual a 50 palabras.

1970

Primer sistema de reconocimiento de voz comercial

Se mejoraron las aplicaciones de los sistemas dependientes del locutor que requerían una entrada discreta y tenia un vocabulario pequeño.

1976

CALCULADORA PARA CIEGOS

Dispositivos móviles electrónicos incluyendo síntesis de voz comenzaron a aparecer en los setentas. Unos de los primeros fue la calculadora para ciegos Speech+ de Telesensory Systems Inc. (TSI)

1980

Desarrollo del vocablo

El reconocimiento de voz se favoreció por tres factores: el crecimiento de computadoras personales, el apoyo de ARPA y los costos reducidos de aplicaciones comerciales. También durante esta época hubo grandes avances tecnológicos, ya que se cambió del enfoque basado en reconocimiento de patrones a métodos de modelado probabilísticos, como los Modelos Ocultos de Markov (HMM)

1985

VIDEO JUEGO CON SINTETIS DE VOZ

El primer videojuego en incluir la síntesis de voz fue el arcade shoot 'em up, Stratovox, de Sunsoft

1990

Años 90

Los costos de las aplicaciones de reconocimiento de voz continuaron decreciendo y los vocabularios extensos comenzaron a ser normales. También las aplicaciones independientes del locutor y de flujo continuo (lo contrario al flujo discreto, es decir, en el habla no hay pausas significantes) comenzaron a ser más comunes.

1992

AT&T "Voice Recognition Call Processing System"

AT&T introdujo su Voice Recognition Call Processing System en: 1992 (llamadas por cobrar, por cargo a tarjeta de crédito, cargos a terceros) a finales de 1993 procesaba 50 millones de llamadas al mes.

1994

CONVERSION DE TEXTO HABLA

El sistema, puesto a la venta en 1994, permite una conversión de texto-habla basada en una completa articulación usando una guía de ondas o una línea de transmisión análoga de la voz humana y conductos nasales controlados por el "modelo distintivo de región" de Carré.

1995

Marcado activado por voz de celulares

En 1995 teléfonos celulares ya ofrecían servicios de marcado activado por voz

2010

Procesamiento del lenguaje natural para responder preguntas

Salio a la luz el reconocimiento de voz Siri. Hace funciones de asistente personal a veces con su propia personalidad para iOS, macOS, tvOS y watchOS. Esta aplicación utiliza procesamiento del lenguaje natural para responder preguntas, hacer recomendaciones y realizar acciones mediante la delegación de solicitudes hacia un conjunto de servicios web que ha ido aumentando con el tiempo.

2015

Telefonía

Algunos sistemas PBX permiten a los usuarios ejecutar comandos mediante el habla, en lugar de pulsar tonos. En muchos casos se pide al usuario que diga un número para navegar un menú.