NVIDIA lanzó un canal abierto de generación de datos sintéticos para la formación de LLM

NVIDIA lanzó un canal abierto de generación de datos sintéticos para la formación de LLM

Noticias IBL | Nueva York

NVIDIA anunció Nemotron-4 340B, una familia de modelos abiertos que los desarrolladores pueden Úselo para generar datos sintéticos para capacitar a los LLM para aplicaciones comerciales en las industrias de atención médica, finanzas, manufactura, comercio minorista y otras.

Los conjuntos de datos sólidos con datos de entrenamiento de alta calidad son prohibitivamente costosos y de difícil acceso. Los datos sintéticos imitan las características de los datos del mundo real.

A través de un permiso único licencia de modelo abierto, Nemotron-4 340B ofrece a los desarrolladores una forma gratuita y escalable de generar datos sintéticos que pueden ayudar a crear potentes LLM.

La familia Nemotron-4 340B incluye modelos base, de instrucción y de recompensa que forman un canal para generar datos sintéticos para entrenar y perfeccionar los LLM.

Los modelos están optimizados con NVIDIA NeMo, un marco de código abierto para el entrenamiento de modelos de un extremo a otro, que incluye curación, personalización y evaluación de datos.

También están optimizados para la inferencia con la biblioteca de código abierto NVIDIA TensorRT-LLM.

Nemotron-4 340B se puede descargar desde Cara de abrazo.