HiFi-GAN: Sintetización de voz avanzada Introducción La síntesis de voz (TTS, Text-to-Speech) es una área fundamental dentro de la generación de audio y voz con inteligencia artificial. En las últimas décadas, el progreso en aprendizaje pro…
WaveGlow: Un vocoder avanzado para texto a voz Introducción En la generación de audio con inteligencia artificial, los vocoders son una herramienta crucial que permiten convertir texto en habla natural. WaveGlow es uno de los vocoders más p…
WaveNet (visión conceptual) Introducción WaveNet es una arquitectura neural generativa que ha revolucionado la síntesis de voz. Su capacidad para generar audio con alta calidad y naturalidad desde texto ha sido crucial en el avance de la TT…