VALL-E, la herramienta de Microsoft que clona tu voz y cualquier sonido ambiental

enero 10, 2023

Microsoft ha creado una herramienta que con solo escuchar un audio de 3 segundos de tu voz , es capaz de hablar como tú, replicando la misma emoción del interlocutor. VALL-E también es capaz de imitar el ruido ambiental.

VALL-E ha sido desarrollada por un equipo de investigadores de Microsoft, basándose en la inteligencia artificial capaz de sintetizar cualquier tipo de voz escuchando un audio de 3 segundos. También puede entonar casi la misma emoción del interlocutor e imitar el sonido ambiente.

Te puede interesar: ¡A usar el cerebro y a escribir! GPTZero descubre textos hechos con inteligencia artificial

La apuesta es fuerte en este 2023 por parte de Microsoft, con herramientas de IA como ChatGPT, la cual añadirá al buscador Bing antes de abril para competir con el gigante de las búsquedas, Google.

Entre tanto, el nuevo modelo de IA de texto a voz es capaz de analizar una voz específica, la intención del interlocutor y sintetizar el audio para decir cualquier cosa que se te ocurra.

Recordemos que FakeYou es una herramienta similar que se hizo famosa en internet a mitad del año pasado, por imitar con éxito diferentes voces de personalidades célebres o personajes de ciencia ficción.

VALL-E marca ahora la diferencia, utilizando un modelo de lenguaje de códec natural. Similar al que Meta desplegó en octubre de 2022, mediante un tipo de tecnología conocida como EnCodec.

Te puede interesar: ChatGPT de OpenAI no es único. Seis empresas más, desarrollan lenguaje artificial

Microsoft también ha utilizado una biblioteca de audio llamada LibriLight, que ha sido desarrollada por Meta, aunque contiene mayormente conversaciones de habla inglesa de más de 7.000 personas de la plataforma LibriVox.

El objetivo es aprovechar esta IA para lograr una mejor calidad en las herramientas para pasar de voz a texto, en aplicaciones como WhatsApp, por ejemplo. Sin embargo, también lanzan una advertencia ante el uso indebido de este tipo de tecnologías.

“Dado que VALL-E podría sintetizar el habla que mantiene la identidad del hablante, puede conllevar riesgos potenciales en el uso indebido del modelo, como falsificar la identificación de voz o hacerse pasar por un hablante específico. Para mitigar tales riesgos, es posible construir un modelo de detección para observar si un clip de audio ha sido sintetizado por VALL-E. También pondremos en práctica los principios de IA de Microsoft cuando desarrollemos más los modelos”, especifican los investigadores.

Te puede interesar: X-Ray, la herramienta que te mostrará el detrás de cámaras de las producciones de Prime Video

Microsoft no ha anunciado el uso de este modelo en alguno de sus productos o si solo corresponde a otro importante avance de la inteligencia artificial para 2023. Actualmente, VALL-E contiene ejemplos en castellano.

Imagen: Pixaby

Digna Irene Urrea

Comunicadora social y periodista apasionada por las buenas historias, el periodismo literario y el lenguaje audiovisual. Aficionada a la tecnología, la ciencia y la historia.

View all posts

VALL-E, la herramienta de Microsoft que clona tu voz y cualquier sonido ambiental

Te puede interesar: ¡A usar el cerebro y a escribir! GPTZero descubre textos hechos con inteligencia artificial

Te puede interesar: ChatGPT de OpenAI no es único. Seis empresas más, desarrollan lenguaje artificial

Te puede interesar: X-Ray, la herramienta que te mostrará el detrás de cámaras de las producciones de Prime Video

Digna Irene Urrea

Relacionados

Así funciona “Comprar por Mí”, lo nuevo de Amazon ¿Realmente lo hace?

Usuarios de DiDi ahora pueden grabar sus trayectos en tiempo real y verificar su identidad para mayor seguridad

Conoce el truco para navegar con Waze sin conexión a Internet y ahorrar datos

Apps predeterminadas vs. descargadas ¿Cuál es la diferencia y cuáles son los beneficios de cada una?

Nubank lanza “Boleto Compartido” para el pago de cuentas en grupo o división de gastos: Así funciona

“Intereses”, la nueva función de Amazon que te ayuda a descubrir lo que realmente te gusta y apasiona

Lo más leído de la semana

Final de la Copa del Rey 2025: Barcelona vs. Real Madrid ¿Cuándo es y dónde ver el partido?

Xiaomi 15 y 15 Ultra llegan a Colombia, celulares con cámaras avanzadas para fotografía profesional: Precio y disponibilidad

Remake de ‘¿Y dónde está el policía?’ con Liam Neeson ya tiene tráiler oficial ¿Para cuándo su estreno?

Nubank lanza opción de ahorro con rendimientos del 15% al 110% y liquidez inmediata, ¿en qué países aplica?

¿Por qué el 5G es un fracaso costoso? ¿Grandes promesas y realidad decepcionante?

Así quedaría el precio de un iPhone por cuenta de los aranceles de Trump ¿Vale la pena comprar uno ahora?

Elon Musk se despide del gobierno de Trump ¿Qué pasó y cuándo deja el cargo?

Alerta sanitaria en EE. UU.: el hantavirus que mató a la esposa de Hackman deja cuatro víctimas ¿Cómo se transmite?

Archivos

VALL-E, la herramienta de Microsoft que clona tu voz y cualquier sonido ambiental

Te puede interesar: ¡A usar el cerebro y a escribir! GPTZero descubre textos hechos con inteligencia artificial

Te puede interesar: ChatGPT de OpenAI no es único. Seis empresas más, desarrollan lenguaje artificial

Te puede interesar: X-Ray, la herramienta que te mostrará el detrás de cámaras de las producciones de Prime Video

Digna Irene Urrea

You may also like

Relacionados

Lo más leído de la semana

Archivos