Noticias IBL | Nueva York
NVIDIA anunció Nemotron-4 340B, una familia de modelos abiertos que los desarrolladores pueden Úselo para generar datos sintéticos para capacitar a los LLM para aplicaciones comerciales en las industrias de atención médica, finanzas, manufactura, comercio minorista y otras.
Los conjuntos de datos sólidos con datos de entrenamiento de alta calidad son prohibitivamente costosos y de difícil acceso. Los datos sintéticos imitan las características de los datos del mundo real.
A través de un permiso único licencia de modelo abierto, Nemotron-4 340B ofrece a los desarrolladores una forma gratuita y escalable de generar datos sintéticos que pueden ayudar a crear potentes LLM.
La familia Nemotron-4 340B incluye modelos base, de instrucción y de recompensa que forman un canal para generar datos sintéticos para entrenar y perfeccionar los LLM.
Los modelos están optimizados con NVIDIA NeMo, un marco de código abierto para el entrenamiento de modelos de un extremo a otro, que incluye curación, personalización y evaluación de datos.
También están optimizados para la inferencia con la biblioteca de código abierto NVIDIA TensorRT-LLM.
Nemotron-4 340B se puede descargar desde Cara de abrazo.
Nemotron 340b…guau pic.twitter.com/zYlDCGjZKc
— MatthewBerman (@MatthewBerman) 18 de junio de 2024