-
1870's Alexander Graham Bell:
Quería construir un sistema/dispositivo que hiciera el habla visible a las personas con problemas auditivos. Resultado: el teléfono -
1880's Tihamir Nemes:
Solicita permiso para una patente para desarrollar un sistema de transcripción automática que identificara secuencias de sonidos y los imprimiera (texto). Pero fue rechazado como "Proyecto no Realista" -
1910 -30 años después AT&T Bell Laboratories
Construye la primera máquina capaz de reconocer voz (basada en Templates) de los 10 dígitos del Inglés. Requería extenso reajuste a la voz de una persona, pero una vez logrado tenía un 99% de certeza. Por lo tanto surge la esperanza de que el reconocimiento de voz es simple y directo -
1960
La mayoría de los investigadores reconoce que era un proceso mucho más intrincado y sutil de lo que habían anticipado.
Dependientes del Locutor.
Flujo discreto de habla (con espacios / pausa sentre palabras)
Vocabulario pequeño (menor o igual a 50 palabras)
Estos sistemas empiezan a incorporar técnicas de normalización del tiempo (minimizar diferencia en velocidad del habla)
Además, ya no buscaban una exactitud perfecta en el reconocimiento. -
IBM y CMV trabajan en reconocimiento de voz contínuo pero no se ven resultados hasta los 1970's
Principios 1970's : se produce el 1er Producto de reconocimiento de voz, el VIP100 de Threshold Technology Inc. (utilizaba un vocabulario pequeño, dependiente del locutor, y reconocía palabras discretas ). Gana el U.S. National Award en 1972. -
80's a 90's:
Surgen los sistemas de vocabulario amplio, que ahora son la norma. (más de1000 palabras) . Adicionalmente bajan los precios de estos sistemas.
Empresas importantes actualmente: Philips Lernout & Hauspie Sensory Circuits Dragon Systems Speechworks Vocalis Dialogic Novell Microsoft NEC, Siemens, Intel (apoyo / soporte técnico), entre otros.