12 de Junio, 2019 10:57
La voz computarizada fue, de alguna manera, despreciada por años en el mundo de la tecnología.
Existieron interesantes esfuerzos para que los sistemas hablasen o bien, entendiesen órdenes vía voz, que se podían ejecutar en todo tipo de programas.
Sin embargo, por algún motivo, a la gente no le terminaba de gustar que los dispositivos hablaran.
Pero esto cambió y el hecho de que por voz podamos comunicarnos con nuestro teléfono para darle órdenes a Siri o a Alexa, parece convertirse en ya un tema común o cotidiano.
Obviamente todos estos asistentes deben hablar con una voz masculina o femenina y hay incluso empresas que venden la voz para diversas aplicaciones y prácticamente en la todos los idiomas más populares.
Es un negocio tecnológico muy curioso e interesante.
La voz de los asistentes electrónicos muchas veces es neutra, es decir, es de hombre o mujer y ya, aunque algunos estudios indican que a la mayoría de las personas les gusta más tener un asistente con voz femenina.
VIDEO: Zuckerberg dice que controla nuestras vidas y futuro, y es tan aterrador como falso
Hay incluso propuestas de tener un asistente por voz en donde no exista el género del mismo y no podamos discernir si el sistema habla como mujer o como hombre.
En otros casos, algunas aplicaciones permiten cambiar la voz e incluso poner a personajes como Darth Vader o Yoda, quienes nos hablan desde el teléfono o la tablet, y el resultado final hasta divertido es.
Sin embargo, ahora un grupo de ingenieros de Facebook hizo algo muy interesante: clonaron la voz de Bill Gates, y para demostrarlo se pueden escuchar las siguientes frases que el exCEO de Microsoft no dijo nunca:
“A cramp is no small danger on a swim.
”
“He said the same phrase thirty times.
”
“Pluck the bright rose without leaves.
”
“Two plus seven is less than ten.
”
Los clips de voz se generaron por un sistema de aprendizaje de máquinas llamado MelNet, que fue diseñado y creado por los ingenieros de Facebook.
Hay que decir que el sistema pudo generar la voz de otros personajes, incluyendo George Takei, Jane Goodall y Stephen Hawking, los cuales pueden escucharse aquí.
Para poder generar y clonar la voz de los personajes en cuestión, se requirió un conjunto de 452 horas de pláticas en las conferencias TED.
El resto vino de datos de audio libros debido a que en este caso se busca hacer énfasis para darle tono a lo que el escucha de un audio libro está escuchando.
Y aunque los resultados son asombrosos con MelNet, hay que reconocer que la mayoría del progreso en este campo data del 2016, cuando se hizo público SampleRNN y WaveNet, en donde este último er un programa de texto a voz, creado por DeepMind y que hoy en día funciona con Google Assistant.
El enfoque básico con WaveNet, SampleRNN y programas similares, es el alimentar con toneladas de datos el cómo los seres humanos hablan, y aunque WaveNet y otros programas, se entrenaron usando ondas de audio, MelNet de Facebook usa una herramienta extra: el espectrograma.
Facebook ahora te dará dinero por entregar tus datos personales
El el correspondiente artículo técnico, los investigadores de Facebook hacen notar que WaveNet produce audio de mayor fidelidad, pero MelNet es superior en capturar “las estructuras de alto nivel”, las sutilezas al hablar e irónicamente, lo que parece muy difícil de describir, que es cómo el oído humano está acostumbrado a entender estas sutilezas del habla.
El uso de espectrograma es “más compacto por órdenes de magnitud” con respecto a las ondas de audio.
Esta densidad permite al algoritmo producir voces más consistentes
Por supuesto que todo este enfoque tiene sus propias limitaciones.
El más importante es que el modelo no puede replicar cómo cambia la voz humana en largos periodos de tiempo.
Esto es bastante similar a lo que se ha visto al generar texto con Inteligencia Artificial, que captura muchas veces la coherencia a nivel superficial, pero no la estructura de largo plazo.
Cabe decir también que el sistema MelNet puede generar música incluso.
Como todas las tecnologías, hay beneficios y peligros.
Los beneficios son sin duda evidentes: mejores asistentes personales por audio, voces más realistas para personas con discapacidades del habla e incluso, para la industria de los videojuegos.
Los peligros tienen que ver con la verdad sobre las evidencias en la forma tradicional, así como el uso de esta tecnología para hacer creer que alguien dice algo impropio o políticamente incorrecto.
La realidad es que para un sentido o el otro, las posibilidades son ilimitadas.
La entrada Facebook clona por computadora la voz de Bill Gates se publicó primero en unocero.
Paola Jiménez AC/DC se ha consolidado como una de las bandas más importantes del rock y hay buenas noticias para todos aquellos que son fans de la agrupación originaria de Australia, ya que dentro de unos meses estarán en México.Esta mañana, la AC/DC y Ocesa dieron a conocer que estarán de regreso en México como parte de su gira “Power Up
Excelsior
Despegar fue reconocida por OpenAI entre los principales usuarios globales de inteligencia artificial, consolidando su liderazgo en innovación y tecnología en la industria de viajes Despegar, la empresa de tecnología de viajes líder en Latinoamérica, fue reconocida entre los principales usuarios globales de la API de OpenAI, una distinción qu
AlMomento.mx
La respuesta a cuál es la mejor tarjeta de crédito en línea depende completamente de tu perfil financiero, tus hábitos de consumo y tus objetivos. Algunas personas priorizan el cashback, otras buscan meses sin intereses, y hay quienes necesitan una opción sin comprobar ingresos.
Lado.mx
La digitalización de pagos ha transformado el panorama comercial. Con más de 5 millones de terminales activas en el país y un mercado que alcanzará los 2.73 mil millones de dólares para 2030, convertirse en distribuidor de terminales POS representa una oportunidad sólida para emprendedores. Este modelo permite generar ingresos recurrentes mie
Lado.mx
23 de octubre de 2025 Su nombre rara vez aparece en la prensa, pero con frecuencia figura en las agendas de quienes no tienen problemas con el dinero, sino con ellos mismos. Karina Matsueva es la persona a la que uno no acude por inspiración, sino por sanación.
Lado.mx
Franco Mastantuono sufre complicada lesión y será baja del Real Madrid por tiempo indefinido El atacante argentino sufre de una pubalgia, de acuerdo a los servicios médicos del club merengue fvillalobosLun, 03/11/2025 - 07:23
Record
Se prevén lluvias fuertes en Veracruz, Tabasco, Oaxaca y ChiapasThe post Se prevén lluvias fuertes en Veracruz, Tabasco, Oaxaca y Chiapas first appeared on Acierta.
Zona Roja
“Carlos Manzo” Asesinaron al alcalde de Uruapan, Carlos Manzo, y el gobernador de Michoacán Alfredo Ramírez Bedolla, acudió al velorio. Ahí, las y los presentes corrieron a gritos al gobernador, quien salió […]La entrada ESFERA PÚBLICA se publicó primero en Resp
Respuesta.com.mx
En la semana 5 de "Exatlón México" son los hombres de la competencia quienes están en riesgo de eliminación.
El Financiero
Durante una caravana con motivo por el Día de Muertos se registró la explosión de pirotecnia en el municipio de Mazatepec.
24 Horas
Las autoridades han comenzado a identificar a las víctimas, cuyas historias reflejan la vida cotidiana de una comunidad que hoy está de luto.
El Imparcial
Real Madrid escogió un éxito de Metallica como "nuevo himno" para el Santiago Bernabéu Para el partido contra el Valencia, los jugadores del Real Madrid salieron al terreno de juego con un clásico de Metallica molveraDom, 02/11/2025 - 18:13
Record
Champions League: Los 5 juegos imperdibles de la Jornada 4 en la Fase de Liga Continua la fase de liga en la Champions League y estos son los juegos imperdibles en esta jornada molveraDom, 02/11/2025 - 18:54
Record
Sassuolo vs Genoa EN VIVO Serie A Jornada 10 El equipo del mexicano Johan Vásquez enfrenta un partido vital en la lucha por el no descenso i.fernandezLun, 03/11/2025 - 09:13
Record
Redacción/Sol Yucatán El próximo 7 de mayo de 2022 se estará realizando el Festival Pulso GNP en el Antiguo Aeropuerto de Querétaro, y la agrupación estará encabezando tan increíble evento. En el cartel publicado para compartir la noticia, podemos encontrar el nombre de la banda inglesa, además de The Neighbourhood, Cold War Kids, Hot Chip
Sol Yucatán
Paola Jiménez The Neighbourhood es una banda de rock liderada por Jesse Rutherfod que con sus varios años de carrera han logrado acumular miles de fans, entre ellos en México, y para ellos hay buenas noticias, ya que la agrupación regresará a nuestro país.Con motivo del décimo aniversario de su disco “Wipe Out!”, The Neighbourhood estar
Excelsior
Paola Jiménez AC/DC se ha consolidado como una de las bandas más importantes del rock y hay buenas noticias para todos aquellos que son fans de la agrupación originaria de Australia, ya que dentro de unos meses estarán en México.Esta mañana, la AC/DC y Ocesa dieron a conocer que estarán de regreso en México como parte de su gira “Power Up
Excelsior
Radiohead regresa a los escenarios con su primera gira en siete años La legendaria banda británica Radiohead vuelve en 2025 lreyesMié, 03/09/2025 - 13:28
Record
¡Feid la rompió! Su Coffee Party en CDMX entra al Guinness World Records Feid rompe récord en la Plaza de Toros México con su “Coffee Party” lreyesSáb, 04/10/2025 - 15:10
Record
Denuncian a titular del OIC del IPN por presunta intimidación y encubrimiento de anomalías Los señalamientos fueron en contra de Mireya María Zuleta jreyesMié, 29/10/2025 - 18:00
Record
Últimas noticias
Los aranceles, el arma suprema de Trump, a juicio ante la Corte Suprema
Agresor de Carlos Manzo tenía entre 17 y 19 años
Reportan a ex alcalde de Zinapécuaro desaparecido, en Michoacán
Trump planea una misión para enviar tropas contras cárteles en México
¿Quién es Alejandro Correa Gómez? Ex alcalde de Zinapécuaro desaparecido en Michoacán
Cárteles ofrecen 10,000 dólares para atacar agentes de la Border Patrol en Texas
Citi México: una nueva etapa centrada en liderazgo global y servicio corporativo
“Más que una despensa, el DIF es una esperanza”: José Luis Morales con Aurora Jiménez
Glifos de Teotihuacán: una nueva pista reaviva un debate arqueológico
Ataca enjambre de abejas a visitantes del Panteón Guadalupe en Monclova
La feria del Modelismo en Seine-et-Marne para los amantes de los trenes en miniatura.
Brindan Ángeles Verdes 21 atenciones diarias en promedio en Tamaulipas
Rastro TIF de la UAT producirá carne para el mercado internacional
Celebra la UAT tradiciones mexicanas con actividades en todas sus sedes
Negociadores indios y de la UE inician conversaciones para resolver cuestiones pendientes del TLC