Todas las Sensaciones: NVIDIA comparte la Investigación de Síntesis de Voz Expresiva en Interspeech
/COMUNICAE/ NVIDIA permite a los desarrolladores y creadores de IA conversacional con modelos de vanguardia para la síntesis de voz expresiva que pueden expresar personajes, asistentes virtuales y avatares personalizados. La IA ha transformado el habla sintetizada del tono monótono de las llamadas automáticas y los primeros sistemas de navegación GPS al tono profesional y fresco de los asistentes virtuales en los smartphones y los altavoces. Pero todavía existe una brecha entre el habla sintetizada por IA y el habla humana que se escucha en la conversación diaria y en los medios de comunicación. La gente habla con un ritmo, entonación y timbre complejos que es un desafío para la IA emular. Para ayudar a los desarrolladores y creadores, los investigadores de NVIDIA están creando modelos y herramientas para una síntesis de voz controlable y de alta calidad que captura la riqueza del habla humana, sin artefactos de audio. Estos modelos pueden ayudar a las líneas de servicio al cliente..