-
Primeros Intentos de Producción
-
Christian Gottlieb Kratzenstein
Científico Danés, construyó modelos del tracto vocal que podría producir las cinco vocales largas (a, e, i, o, u). -
Alexander Graham Bell
Quiso desarrollar un dispositivo capaz de proporcionar la palabra visible para la gente que no escuchara. Bell no tuvo éxito creando este dispositivo, sin embargo, el esfuerzo de esta investigación condujo al desarrollo del teléfono. Inicio del Reconocimiento de la Voz -
WH Preece y A. Stroh
Examinaron bajo microscopio las estrías producidas por el gramófono. Intentan descubrir la Naturaleza Física de los sonidos -
ARTEFACTOS QUE RECONOCEN LA VOZ
Los laboratorios de AT & T y Bell desarrollaron artefactos primitivos que podían reconocer la voz. Éstos científicos sabían que el éxito y la globalización de esta tecnología iba a depender de su habilidad de percibir Información verbal COMPLEJA, con alta precisión. -
MODELADOR DE TRACTO VOCAL
Se creo un modelador de tracto vocal y se lograba un gran mejora de los resultados con respecto a los proporcionados por el Voder. -
Aplicaciones de la modulación de la Voz
Comenzaron a realizar aplicaciones con vocabularios pequeños,dependientes del locutor y con palabras de flujo discreto -
Primer sistema de reconocimiento de voz
EL primer sistema de reconocimiento de voz fue desarrollado en 1952 sobre una computadora analógica que reconocía dígitos del 0 al 9,este sistema era dependiente del locutor -
DEPENDIENTES DEL LOCUTOR
Dependientes de locutor. Flujo discreto de habla,( con espacios/ pausa entre palabras). Vocabulario pequeño ( menor o igual a 50 palabras. -
Primer sistema de reconocimiento de voz comercial
Se mejoraron las aplicaciones de los sistemas dependientes del locutor que requerían una entrada discreta y tenia un vocabulario pequeño. -
CALCULADORA PARA CIEGOS
Dispositivos móviles electrónicos incluyendo síntesis de voz comenzaron a aparecer en los setentas. Unos de los primeros fue la calculadora para ciegos Speech+ de Telesensory Systems Inc. (TSI) -
Desarrollo del vocablo
El reconocimiento de voz se favoreció por tres factores: el crecimiento de computadoras personales, el apoyo de ARPA y los costos reducidos de aplicaciones comerciales. También durante esta época hubo grandes avances tecnológicos, ya que se cambió del enfoque basado en reconocimiento de patrones a métodos de modelado probabilísticos, como los Modelos Ocultos de Markov (HMM) -
VIDEO JUEGO CON SINTETIS DE VOZ
El primer videojuego en incluir la síntesis de voz fue el arcade shoot 'em up, Stratovox, de Sunsoft -
Años 90
Los costos de las aplicaciones de reconocimiento de voz continuaron decreciendo y los vocabularios extensos comenzaron a ser normales. También las aplicaciones independientes del locutor y de flujo continuo (lo contrario al flujo discreto, es decir, en el habla no hay pausas significantes) comenzaron a ser más comunes. -
AT&T "Voice Recognition Call Processing System"
AT&T introdujo su Voice Recognition Call Processing System en: 1992 (llamadas por cobrar, por cargo a tarjeta de crédito, cargos a terceros) a finales de 1993 procesaba 50 millones de llamadas al mes. -
CONVERSION DE TEXTO HABLA
El sistema, puesto a la venta en 1994, permite una conversión de texto-habla basada en una completa articulación usando una guía de ondas o una línea de transmisión análoga de la voz humana y conductos nasales controlados por el "modelo distintivo de región" de Carré. -
Marcado activado por voz de celulares
En 1995 teléfonos celulares ya ofrecían servicios de marcado activado por voz -
Procesamiento del lenguaje natural para responder preguntas
Salio a la luz el reconocimiento de voz Siri. Hace funciones de asistente personal a veces con su propia personalidad para iOS, macOS, tvOS y watchOS. Esta aplicación utiliza procesamiento del lenguaje natural para responder preguntas, hacer recomendaciones y realizar acciones mediante la delegación de solicitudes hacia un conjunto de servicios web que ha ido aumentando con el tiempo. -
Telefonía
Algunos sistemas PBX permiten a los usuarios ejecutar comandos mediante el habla, en lugar de pulsar tonos. En muchos casos se pide al usuario que diga un número para navegar un menú.