El avance de NVIDIA Inference hace que la IA Conversacional sea más Inteligente e Interactiva
/COMUNICAE/ La IA Conversacional se hace más Inteligente e Interactiva desde la Nube hasta el Borde. TensorRT 8 ofrece a las empresas líderes en el sector de la Salud, la Automoción y las Finanzas el Rendimiento de Inferencia de IA más rápido del Mundo El día de hoy, NVIDIA lanzó TensorRT™ 8, la octava generación del revolucionario software de inferencia de la compañía, que reduce el tiempo de inferencia a la mitad para las consultas de idiomas, lo que permite a los desarrolladores crear los motores de búsqueda, las recomendaciones de anuncios y los chatbots con mejor rendimiento del mundo y ofrecerlos desde la nube hasta el borde and offer them from the cloud to the edge. Las optimizaciones de TensorRT 8 brindan una velocidad récord para aplicaciones de idiomas, ejecutando BERT-Large, uno de los modelos basados en transformadores más utilizados en el mundo, en 1.2 milisegundos. En el pasado, las empresas tenían que reducir el tamaño de su modelo, lo que generaba resultados signific..