Nonamed
24/05/21, 10:31:26
La nueva y sorprendente IA de Facebook es capaz de transcribir de voz a texto sin haber sido entrenada con transcripciones
https://www.static.htcmania.com/oie_24103052CYLTnRfW-2.jpg
Leemos en xataka.com
"Cuando se entrena un sistema de inteligencia artificial para transcribir de voz a texto es necesario usar muchos pares de audio y texto. Es decir, le damos a la IA el sonido "esto es un gato" y ese mismo sonido transcrito, de forma que sea capaz de asociar cada palabra a un sonido. Eso es perfecto para lenguajes muy extendidos, como el inglés o el español, pero no para los idiomas más minoritarios. Facebook, sin embargo, asegura haber encontrado una solución: wav2vec-U, con "U" de "Unsupervised". ¿Qué es wav2vez-U? Es una forma de construir un sistema de reconocimiento de voz que no requiere ningún tipo de par transcrito. Simplemente aprende del audio y de texto desemparejado, lo que elimina por completo la necesidad de tener audio transcrito. Para ello, el sistema se vale de una GAN (red generativa antagónica) que, de acuerdo a Facebook, compite de tú a tú con los mejores sistemas supervisados de hace unos años."
fuente: xataka.com (https://www.xataka.com/robotica-e-ia/nueva-sorprendente-ia-facebook-capaz-transcribir-voz-a-texto-haber-sido-entrenada-transcripciones)
https://www.static.htcmania.com/oie_24103052CYLTnRfW-2.jpg
Leemos en xataka.com
"Cuando se entrena un sistema de inteligencia artificial para transcribir de voz a texto es necesario usar muchos pares de audio y texto. Es decir, le damos a la IA el sonido "esto es un gato" y ese mismo sonido transcrito, de forma que sea capaz de asociar cada palabra a un sonido. Eso es perfecto para lenguajes muy extendidos, como el inglés o el español, pero no para los idiomas más minoritarios. Facebook, sin embargo, asegura haber encontrado una solución: wav2vec-U, con "U" de "Unsupervised". ¿Qué es wav2vez-U? Es una forma de construir un sistema de reconocimiento de voz que no requiere ningún tipo de par transcrito. Simplemente aprende del audio y de texto desemparejado, lo que elimina por completo la necesidad de tener audio transcrito. Para ello, el sistema se vale de una GAN (red generativa antagónica) que, de acuerdo a Facebook, compite de tú a tú con los mejores sistemas supervisados de hace unos años."
fuente: xataka.com (https://www.xataka.com/robotica-e-ia/nueva-sorprendente-ia-facebook-capaz-transcribir-voz-a-texto-haber-sido-entrenada-transcripciones)