Actualizado el 17/12/2024

icon Facebook icon Twiiter icon RSS icon EMAIL
  1. Portada
  2. >
  3. Noticias
  4. >
  5. OpenAI da a conocer Voice Engine, su clonador de voz

OpenAI da a conocer Voice Engine, su clonador de voz

Escrito por Guillem Alsina el 16/04/2024 a las 08:29:32
369

Con tan sólo quince (15) segundos de audio grabado, Voice Engine es capaz de reproducir cualquier texto escrito que se le pase, como si lo hubiera recitado la misma voz de la grabación, según indican desde OpenAI.


Los creadores de ChatGPT han anunciado al público su nueva herramienta de inteligencia artificial, esta vez, un ‘clonador’ de voz, del cual ya han llevado a cabo una prueba a pequeña escala, y su objetivo ahora es el de iniciar un diálogo para conocer y delimitar las responsabilidades que se derivan de esta nueva herramienta.


A partir de lo que se derive de esta y las siguientes pruebas a pequeña escala que se realicen, la empresa establecerá los términos en los que se abrirá su herramienta al público y los plazos en los que lo hará, para evitar un uso fraudulento de esta.


En el pasado reciente, ya se han dado algunos casos de uso fraudulento de voces clonadas mediante inteligencia artificial para la realización de ciberdelitos o fake news, por lo que OpenAI tiene que ir con mucho cuidado sobre quién y para qué va a utilizar esta herramienta cuando la ponga a disposición de los usuarios.


Además de incluir algunos ejemplos de voces sintetizadas en el anuncio público de Voice Engine, la empresa explica las áreas en las que su herramienta de sintetización de voz por IA puede tener aplicación.


Entre estas, tenemos la asistencia a la lectura para niños así como a personas invidentes, ya que las voces generadas que se consiguen, expresan entonaciones y suenan con la emoción de una persona real.


La traducción de contenido también entra dentro de las capacidades de Voice Engine, aprovechando las facilidades de traducción de GPT-4. Así, sería capaz de traducir el audio de vídeos y podcasts como si de un doblador profesional se tratara. Además, y cuando se utiliza para este fin, la traducción preserva el acento nativo de la grabación original, es decir: si quien habla en inglés es, en realidad, un francés, el audio traducido al idioma que sea (pongamos alemán) sonará con el mismo acento francés nativo.


Y una de las aplicaciones que tal vez sea más importante es la de ayudar a pacientes de alguna enfermedad que han perdido la voz, a recuperarla, de una forma similar a la que se hizo con Val Kilmer -afectado de un cáncer de laringe que le impedía hablar con normalidad- para la película Top Gun II.


De cada uno de estos usos ya se han realizado algunas pruebas cerradas.