PDA

Ver la versión completa : Dominación de la voz.



Magally
10/01/2006, 02:00
_____
La guerra por la total dominación de la Red sigue adelante. Ya son varios los que han caído o han sido absorbidos. Netscape es un nombre del cual ya nadie se recuerda. (Para los que no lo saben fue el primer y más poderoso de los navegadores. La dominación de la Red es un objetivo que han estado persiguiendo muchos. Naturalmente el más persistente en ello ha sido Bill Gates, quien se dio cuenta desde el primer momento que la red invadiría todas las actividades comerciales y gran parte de las personales. La dominación de las redes de área amplia lo es todo.

Google creció de un simple buscador a uno de los contendientes más prominentes en la Internet. Es considerado el buscador más eficiente y rápido, de cientos existente. Ha ido agregando servicios y absorviendo muchos proveedores. Hace poco incluyó un sistema de correo electrónico totalmente gratuito, GMail, que incluso sobrepasa las características de otros que son pagados. Con ello ha conseguido posicionar su marca, Google, en el primer. Ahora puede ponerse a vender lo que se le ocurra y tendrá éxito instantáneo.

Entre los servicios que está pensando dar se encuentra una biblioteca virtual gratuita, que incluirá textos donados por la Universidades de Harvard, Stanford, Oxford, Michigan, y la New York Public Library. Esto convertirá a Google en la base de datos más grande del planeta. Siendo ya un buscador tan eficiente, lo convertirá instantáneamente en la fuente de información obligada.

De ahí la tremenda preocupación Bill Gates que uno de sus ejecutivos, Kai-Fu Lee, haya sido contratado por una empresa competidora, llevándose cocimientos valiosos. Google planea abrir una operación en China Continental a fines de este año, para atraer investigadores y desarrollar nuevas tecnologías. China cuenta con suficiente capital humano ampliamente preparado y se encuentra en pleno desarrollo. (Habiendo comenzado hace muy poco, China cuenta con 108 millones de usuarios de Internet, lo cual representa menos del 7% de su población total. Los Estados Unidos tienen 130 millones de usuarios un 67% de su población conectado a la red).

Dr. Lee, es un ex investigador de la Universidad Carnegie Mellon, el cual trabajó anteriormente para Apple Computers, a cargo de un departamento desarrollando reconocimiento de voz y otras tecnologías interactivas para computadoras.

Bill Gates ha demandado judicialmente a Lee, alegando que el ex investigador viola su contrato de trabajo con Microsoft, al tomar un trabajo en Google. El juez que sigue la causa en contra del Dr. Lee, ha decretado una prohibición temporal al investigador para que no trabaje en proyectos relacionados con procesos de lenguajes naturales, reconocimiento de voz o estrategias que puedan competir con los estudios hechos mientras trabajaba en Microsoft.

Lo importante de esta noticia que ha circulado por todos los medios recientemente, no es el desenlace del juicio. Los abogado discutirán amplia y extensamente los derechos y obligaciones de los trabajadores de alto nivel, investigadores y otros que tienen acceso a los proyectos y el futuro de las tecnologías. Tampoco nos interesa si al final del juicio Kai-Fu se queda sin empleo en Google, porque si es astuto, como debe serlo, creará su propia empresa y venderá servicios a todo el que lo requiera, como contratista independiente.

Otro aspecto interesante de este asunto, en el cual se debe reflexionar, es la importancia del "conocimiento", que ambas empresas ven en el Dr. Lee. Este hombre debe saber mucho más de lo que imaginamos en materias relacionadas con el reconocimiento de voz, sonidos y transferencia de palabras.

Lo que a nosotros nos llama la atención, desde el punto de vista de las tendencias del mercadeo, es lo que se puede encontrar entre líneas en estas informaciones. En este caso son los esfuerzos de varios grupos competidores, por acceder y controlar las tecnologías de reconocimiento de voz e interactividad por medio de las redes de área amplia, una de ellas conocida como Internet.

Esto significa que son varias las empresas que andan buscando la forma de incorporar la voz en las tecnologías de computación, de tal modo que eliminemos los teclados y los cambiemos por micrófonos. Esto al igual que lo que veíamos en la serie de televisión "Star Trek". De hecho el mouse es muy parecido a un micrófono, y no nos será difícil acostumbrarnos a darle órdenes a los equipos diciendo algo así como: "PC conéctame con mi casa". Esto nos lleva a pronosticar grandes transformaciones en las tecnologías que ahora conocemos y usamos como son la telefonía, radio, TV, cine e inclusive las formas de publicidad.

Todo esto agregado a lo que se ha dado en llamar "convergencia de tecnologías" nos promete un futuro divertido y emocionante en extremo.

Jorge Pereira.
Liderazgo y mercadeo.com

Frs
10/01/2006, 02:35
Magally.

Lei tu mensaje, que es muy extenso, y claro ese investigador de la mac, que trabaja en microsoft y despues en google.

Pues ya hizo de las suyas en la mac.

Les presento una nota, de la verdadera opcion de mac, en todos sus computadores nuevos.

Swift Text to Speech (TTS) es un sistema hablado que reconoce el texto y que gracias a la calidad de las voces de Cepstral, se consigue un resultado muy natural.
Apple ya incorporó un sistema de reconocimiento de texto hablado en sus sistemas operativos, pero con el nuevo Cepstral 3.2 las voces se integran en el sistema de Apple (Apple Speech Manager) y están disponibles para todos las aplicaciones y sistemas que utilicen TTS. Esta tecnología se integra con: menús, alertas, navegadores web, editor de textos, y todo ello si necesidad de lanzar otro programa adicional.
Cepstral tiene 18 voces en 6 lenguajes a un precio de 30 $ cada una.

Magally
10/01/2006, 02:40
Interesante...

Frs
10/01/2006, 02:59
MCL Technologies y Vocollect ofrecen Reconocimiento de Voz para Ordenadores Portátiles

Londres, R.U. 7 de junio, 2005 - MCL Technologies, líder reconocido del desarrollo de software de alta productividad para aplicaciones laborales transportables, y Vocollect, líder mundial en soluciones laborales dirigidas por voz, (voice-directed work), acaban de anunciar el lanzamiento de la Colección MCL con Vocollect Voice ™.

La Colección MCL es un paquete de software sofisticado, para crear, integrar e implementar aplicaciones laborales multifuncionales y transportables de manera sencilla y rápida. Ahora, la Colección MCL con Vocollect Voice , aporta a estas aplicaciones la entrada y salida de datos controladas por voz.

La Colección MCL con Vocollect Voice, representa el fruto de dos años de esfuerzo conjunto entre MCL y Vocollect para integrar Vocollect Voice en la Colección MCL”, afirma Larry Sweeney, vicepresidente de gestión de producto de Vocollect. “Nuestra colaboración con MCL hace posible aportar los beneficios de la tecnología de voz a los dispositivos de mano que funcionan con pantalla para los equipos de trabajo móviles.”

Capaz de traducir de forma fiable la voz humana en datos transaccionales, y de transformar éstos a su vez en una salida de comunicación hablada, Vocollect Voice incrementa la productividad y la velocidad de captación de datos en las aplicaciones laborales móviles que se han desarrollado con la Colección MCL.

“Para MCL, todos los métodos de captación de datos son tecnologías complementarias”, declara Jean-François Jacques, Director General de MCL Technologies. “La implementación de voz multimodo de MCL permite a nuestros clientes combinar distintas tecnologías de captación de datos. Sea el escaneado de códigos de barras, captación de imágenes, identificación por frecuencia de radio, entrada de datos por teclado o por reconocimiento de voz, al empleado móvil se le permite la flexibilidad de utilizar la tecnología de captación de datos que mejor convenga para la realización eficaz de la tarea en cuestión. Los clientes no están obligados a elegir un sólo método de captar datos cuando trabajan con las aplicaciones de voz.”

La Colección MCL con Vocollect Voice incluye dos elementos nuevos. El primero, el componente adicional MCL-Designer Add-On con Vocollect Voice, permite la dirección por voz de las aplicaciones móviles creadas con MCL-Designer. El segundo, MCL-Client con Vocollect Voice?, se sitúa en el ordenador portátil y ejecuta las aplicaciones dirigidas por voz creadas por MCL-Designer con su componente adicional Vocollect Voice .

MCL-Collection con Vocollect Voice opera en un ámbito de sistemas abiertos. Permite dirigir por voz las aplicaciones MCL que funcionan en ordenadores portátiles que utilizan Microsoft® Windows® para Pocket PC 2003. La Colección MCL con Vocollect Voice funciona con marcas y plataformas múltiples.

Ya que son cada vez más numerosos los ordenadores portátiles que permiten la dirección por voz, las empresas podrán aprovechar todos los beneficios de la Colección MCL con Vocollect Voice en una amplia gama de aplicaciones laborales móviles, desde la gestión de encaminamiento, el control de calidad, la lectura de contadores, evaluación de siniestros de automóviles por peritos de seguros y aplicaciones sanitarias, entre otras muchas.

Acerca de Vocollect

Cada día, más de 75.000 trabajadores de centenares de empresas en 21 países de 5 continentes utilizan las soluciones laborales dirigidas por voz (Voice-Directed Work Solutions ™) de Vocollect para aumentar la productividad y la precisión de la realización del trabajo y mejorar la satisfacción de los clientes. Pionero desde 1987 en tecnología de reconocimiento de voz para la industria, Vocollect sigue siendo líder mundial en sistemas comerciales dirigidos por voz que recortan los costes operacionales mediante la eliminación de errores y la mejora de la productividad de los trabajadores.

Los principales proveedores de sistemas de gestión de almacenamiento (SGA), los integradores de manejo de materiales y los proveedores especializados de técnicas facilitadas por voz a escala mundial, eligen la calidad y la fiabilidad de Vocollect para asegurar soluciones de distribución “manos libres, ojos libres”.

Macuy
10/01/2006, 12:29
De hecho hace varios años, que tengo en mi pc un sitema para dictado que se integra a mi editor... Tambien una aplicacion para realizar algunas aplicaciones, como apagar mi terminal, conectarme a internet, o abrir algunos pocos programas...

Lo que si tengo que reconocer, es que especialmente el sistema de dictado, no funciona a full, pero con las actualizaciones, si he notado el cambio.

Es realmente interesante ese articulo Magally, porque no estamos lejos de que en nuestro ambiente comun, usemos solo la voz para muchas cosas cotidianas...

A ver que nos depara el futuro

Xaludos