-
MÁQUINA PARLANTE
Aproximadamente por 1769, W.R. Kempelen, ingeniero y arquitecto húngaro, bien situado en el gobierno de su monarquía, ya había comenzado a trabajar en su máquina parlante (speaking machine). Se trataba de un dispositivo mucho más sofisticado, que era capaz de producir también sonidos consonánticos. Esta tarea le ocupó más de 20 años y sus resultados fueron publicados en un extenso volumen de 456 páginas, en 1791. -
Máquina parlante de G. Wheatstone
Esta máquina producía sonidos que eran comunes a todas las lenguas europeas. El inventor
aseguraba que cualquier persona podía lograr en tres semanas realizar síntesis de voz,
realmente sorprendente, en las lenguas francesa, italiana y latina. . Usando la descripción dada por Kempelen, C.
Wheatstone, físico inglés nacido el 6 de febrero de 1802 en Gloucester y muerto el 19 de octubre
de 1875 en París, construyó una versión mejorada de la máquina parlante. -
SE ESCRIBE LA HISTORIA EN RECONOCIMIENTO DE VOZ
Alexander Graham Bell quiso desarrollar un dispositivo capaz de proporcionar la palabra visible para la gente que no escuchara. Bell no tuvo éxito creando este dispositivo, sin embargo, el esfuerzo de esta investigación condujo al desarrollo del teléfono -
DESARROLLO DEL TELÉFONO
Alexander Graham Bell quiso desarrollar un dispositivo capaz de proporcionar la palabra visible para la gente que no escuchara. Bell no tuvo éxito creando este dispositivo, sin embargo, el esfuerzo de esta investigación condujo al desarrollo del teléfono -
Bell Labs. RECONOCIMIENTO DE DÍGITOS AISLADOS MONO LOCUTOR
A principios del año 1940, los laboratorios de AT&T y Bell desarrollaron un aparato primitivo que podía reconocer la voz. Estos científicos sabían que el éxito y la globalización de esta tecnología iba a depender de su habilidad de percibir información verbal compleja, con alta precisión y constancia. -
PRIMER SISTEMA DE RECONOCIMIENTO DE VOZ
El primer sistema de reconocimiento de voz fue desarrollado sobre una computadora analógica que reconocía dígitos del 0 al 9, este sistema era dependiente del locutor, en RCA Lab -
RECONOCIMIENTO FONÉTICO
Reconocedor fonético, creado en University College en Inglaterra -
LA PRIMERA MAQUINA
La primera máquina capaz de reconocer habla fue un perro de juguete , llamado Radio Rex, que avanzaba cuando percibía un tono de 500 hz, que coincidía aproximadamente con el primer formante de la pronunciación de la palabra "Rex", de forma que parecía que el perro avanzaba cuando se le llamaba. -
USO DE VOCABULARIOS MAS EXTENSOS
Advanced Research Projects Agency (ARPA) de la sección Americana de Defensa comenzó investigaciones enfocados al habla continua y usando vocabularios mas extensos, tambien se mejoró la tecnología de reconocimiento para palabras aisladas y continuas. -
PASOS PARA EL RECONOCIMIENTOS DE LA VOZ
Se desarrollaron técnicas para el reconocimiento de voz como: Time warping, modelado probabilístico y el algoritmo de retropropagación -
INICIO DEL DESARROLLO DEL VOCABLO
Durante los 80 el reconocimiento de voz se favoreció por tres factores: el crecimiento de computadoras personales, el apoyo de ARPA y los costos reducidos de aplicaciones comerciales.
El mayor interés era el desarrollo de vocabularios grandes -
NORMALIZACIÓN DE LOS AÑOS 90
Los costos de las aplicaciones de reconocimiento de voz continuaron decreciendo y los vocabularios extensos comenzaron a ser normales. También las aplicaciones independientes del locutor y de flujo continuo (lo contrario al flujo discreto, es decir, en el habla no hay pausas significantes) comenzaron a ser más comunes. -
CMU Sphinx
CMU Sphinx (acortado como Sphinx), es el término general para describir un grupo de sistemas de reconocimiento de voz desarrollado en la Universidad de Carnegie Mellon. Incluye una serie de programas para reconocimiento de voz (Sphinx 2 - 4) y un entrenador modelo acústico (SphinxTrain). -
AVANCES TECNOLÓGICOS
La tecnología de reconocimiento de voz no nació con el iPhone 4s el primero en el que apareció Siri. La atención telefónica lleva utilizando esta forma de interacción muchos años. Y no deja de ser un reflejo de la mejora de la técnica el que la máquina antes entendiera al humano de pascuas a ramos mientras que ahora la precisión ha aumentado. -
USO DE LA VOZ EN COMPUTADORAS Y TELÉFONOS CELULARES
Que Google guarde archivos con grabaciones de nuestra voz y los suba a nuestra cuenta no tendría que ser una sorpresa para muchos, ya que lo lleva haciendo desde el año pasado, cuando lanzó la detección del "Ok Google" desde cualquier pantalla. Y no es la única compañía que lo hace, Apple con Siri también guarda la voz. Es con la activación del "Ok Google" desde cualquier pantalla cuando se comienza a guardar nuestra voz.