12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Meganoticias Veracruz
El enigmático origen de la canción “Hey Joe”Hey Joe es una canción tan grande y popular gracias a que Jimi Hendrix hizo una gran versión de ella y la lanzó como sencillo el 16 de diciembre de 1966. El origen de esta canción es enigmático y es que la autoría de esta rola ha generado controversias y encarnizadas disputas, las cual
Monterrey Rock
Infobae
La temporada navideña llega con ese momento especial en que los hogares se llenan de ilusión y los niños esperan con emoción descubrir qué hay bajo el árbol.
Lado.mx
En este mundo en digital donde cada día se crean nuevas cuentas, servicios y accesos, la gestión segura de contraseñas se ha vuelto esencial para proteger datos personales y empresariales.
Lado.mx
Profesionalizar la operación de un negocio va más allá de ofrecer buenos productos o servicios. En un mercado donde cada vez más personas prefieren pagar con métodos digitales, contar con la infraestructura adecuada es clave. En este sentido, un kit punto de venta completo para negocio ofrece hardware, software y accesorios que ayudan a optimi
Lado.mx
Destacaron que enfermeras, enfermeros, médicas y médicos acudan al llamado del Plan Michoacán, anunciado por la presidenta. La entrada Dan base a 300 trabajadores de la Salud en Michoacán que llevaban años sin contrato se publicó primero en La Voz de Michoacán.
La Voz de Michoacán
La discusión sobre el ajuste salarial enfrenta a representantes de trabajadores y empresarios, que sostienen posturas distantes, mientras el Ejecutivo evalúa la posibilidad de definir el incremento por decreto en las próximas horas
Infobae
Luego del accidente de una aeronave en Toluca, Estado de México surgieron versiones en redes sociales que confirmaban la muerte del comediante, sin embargo es información falsa
Expreso.press
Jesús Gallardo rompió el silencio tras altercado de Juan Pablo Vigón con compañero El jugador del Toluca contó lo sucedido en el medio campo durante la tanda de penales rperezLun, 15/12/2025 - 12:03 Jesús Gallardo reveló lo qu
Record
Ha partido Roberto Mondragón Pérez, quien por casi tres décadas fungió como Director General de XHKG Canal 2 de la televisión de Tepic. Nació en la capital nayarita el 9 de noviembre de 1961; era hijo del pionero de las transmisiones por televisión en nuestro estado, Roberto Mondragón González, y de la señora Lucía Pérez […]The po
NTV
Juan José Zerboni rompió esquemas al iniciar su carrera actoral a los 57 años, participando en exitosas obras, series y programas que hoy celebran su memoria
Infobae
Atlético de San Luis va por refuerzo europeo La plantilla del club potosino aún no está completa; ahora buscan a un jugador en el "Viejo Continente" m.diazSáb, 30/08/2025 - 17:48
Record
Arturo López / Europa PressVarios duelos inéditos se vivirán en los dieciseisavos de final de la Copa del Rey. Los cuatro enfrentamientos más destacados son: CD Guadalajara-FC Barcelona, CF Talavera de la Reina-Real Madrid CF, CD Atlético Baleares-Atlético de Madrid y Ourense CF-Athletic Club.FC Barcelona, Real Madrid CF, Atlético de Madrid
Excelsior
Aarón Mercury y Briggitte Bozzo fueron los primeros famosos en conseguir su pase directo a la recta final
Infobae
El pasado viernes de semifinal del segmento, Las Estrellas Bailan en Hoy, del programa Hoy, no hubo pareja eliminada, sino el resultado del séptimo lugar; tras los últimos votos y calificaciones, Karenka y Manuel Riguezza terminaron su camino en la competencia.Y justo ambos artistas platicaron en exclusiva con El Siglo de Torreón de su experienc
El Siglo de Torreón
Aarón Mercury y Briggitte Bozzo cierran el 2025 como dos de las figuras más queridas y destacadas de la televisión mexicana, gracias a su participación en Las estrellas bailan en Hoy, donde han cautivado al público con su carisma y su imparable éxito. Ambos, figuras que nacieron en la era digital, han logrado conquistar el escenario televisi
El Diario de Sonora
Últimas noticias
Se registran 2 percances de tránsito en diferentes zonas de Morelia; hay 3 heridos
Filtran última comunicación de tripulación antes de desplome de aeronave en Toluca
Desmantelan punto de “halconeo” en zona rural de Apatzingán
Guillermo Almada ya salió al rescate del Real Oviedo del Grupo Pachuca
“Asumiré las críticas”: revelan audio en juicio contra jueza acusada de ayudar a inmigrantes
El aumento de los costos de los alimentos: un desafío para muchos compradores
Repartidor en moto se impacta contra auto que se le atravesó en el Centro de Gómez Palacio
Se registra sexto homicidio en lo que va del mes; reportan disminución del 29% en la capital
TEXTO ÍNTEGRO: Deficiente PLAN de Seguridad HARFUCH- SHEINBAUM; ASESINATOS suman +360 por SEMANA
Piden reparar bache de área peatonal en Las Trancas
SUX innova en Xalapa con cobro de pasaje mediante tarjeta
Armonizan Ley Estatal en materia de extorsión con Reforma Federal
Expertos advierten que un proyecto de ley de defensa podría provocar una repetición de una colisión aérea fatal en Washington D. C.
Guerrero recibió 167 mil 700 apoyos para mujeres de la Sader
Maduro minimiza fractura de María Corina Machado: ‘Tiene rota el alma, es una demonia’