NVIDIA Nemotron 3: la nueva familia de modelos abiertos para crear agentes de IA eficientes

NVIDIA presenta Nemotron 3, una familia de modelos abiertos con arquitectura MoE híbrida diseñada para desarrollar sistemas de IA agentic escalables y eficientes.

Ana Blanco Vigo

23 de dic. de 2025

3 min de lectura

Software

En el panorama actual de la inteligencia artificial, estamos presenciando una transición fundamental: desde los chatbots simples que interactúan de forma individual hasta sistemas donde múltiples agentes de IA colaboran para resolver tareas complejas. Esta evolución promete capacidades extraordinarias, pero también plantea desafíos importantes que requieren soluciones tecnológicas avanzadas.

Los desarrolladores se enfrentan a obstáculos cada vez más complejos: la sobrecarga de comunicación entre agentes, la deriva contextual que reduce la precisión en tareas largas y los costes de inferencia que se disparan al escalar estos sistemas. Además, la falta de transparencia en muchos modelos propietarios dificulta la confianza necesaria para automatizar flujos de trabajo críticos.

Nemotron 3: arquitectura innovadora con MoE híbrido

La familia Nemotron 3 introduce una arquitectura revolucionaria llamada mixture-of-experts (MoE) híbrida latente. Esta tecnología permite que los modelos activen únicamente los parámetros necesarios para cada tarea específica, optimizando drásticamente el rendimiento y reduciendo costes. Es como tener un equipo de especialistas donde solo se activan los expertos relevantes para cada problema.

Los tres modelos que conforman la familia

La familia incluye tres tamaños diseñados para diferentes necesidades:

Nemotron 3 Nano: Un modelo compacto de 30 mil millones de parámetros que activa hasta 3 mil millones por token. Está optimizado para tareas como depuración de software, resumen de contenido y flujos de trabajo de asistente de IA.
Nemotron 3 Super: Con aproximadamente 100 mil millones de parámetros y hasta 10 mil millones activos por token, ofrece mayor precisión para aplicaciones multiagente que requieren colaboración compleja.
Nemotron 3 Ultra: El modelo más potente con unos 500 mil millones de parámetros y hasta 50 mil millones activos por token, diseñado para aplicaciones de IA que demandan investigación profunda y planificación estratégica.

Ventajas y mejoras significativas

La eficiencia del modelo Nano es particularmente notable. Ofrece hasta 4 veces mayor rendimiento de tokens en comparación con su predecesor, Nemotron 2 Nano, y reduce la generación de tokens de razonamiento hasta en un 60%. Esta mejora se traduce directamente en menores costes de inferencia, un factor crucial al escalar sistemas multiagente.

La ventana de contexto de 1 millón de tokens permite al modelo mantener información coherente a lo largo de tareas extensas y de múltiples pasos, mejorando significativamente la precisión en workflows complejos.

Capacidades avanzadas de precisión

La familia Nemotron 3 logra una precisión superior gracias a técnicas avanzadas de reinforcement learning con entrenamiento posterior concurrente en múltiples entornos a gran escala. Este enfoque permite que los modelos se adapten dinámicamente a diversos escenarios y tareas.

Los modelos Super y Ultra utilizan el formato de entrenamiento NVFP4 de 4 bits en la arquitectura NVIDIA Blackwell. Esta tecnología reduce drásticamente los requisitos de memoria y acelera el entrenamiento, permitiendo entrenar modelos más grandes en infraestructura existente sin comprometer la precisión.

Herramientas de código abierto y datasets disponibles

Además de los modelos, NVIDIA ha liberado una colección completa de herramientas de desarrollo para facilitar la creación de agentes especializados. Esto incluye datasets de pretraining, post-training y reinforcement learning que suman tres billones de tokens, proporcionando ejemplos ricos de razonamiento, programación y workflows multi-paso.

Librerías y entornos de desarrollo

Las librerías de código abierto NeMo Gym y NeMo RL ofrecen entornos de entrenamiento y la base de entrenamiento posterior para los modelos Nemotron. Junto con NeMo Evaluator para validar la seguridad y rendimiento del modelo, estas herramientas están disponibles en GitHub y Hugging Face para que cualquier desarrollador pueda comenzar a construir agentes especializados.

El Nemotron Agentic Safety Dataset proporciona telemetría del mundo real para ayudar a los equipos a evaluar y fortalecer la seguridad de sistemas de agentes complejos, un aspecto fundamental al implementar estos sistemas en entornos críticos.

Disponibilidad y adopción temprana

Nemotron 3 Nano ya está disponible en Hugging Face y a través de proveedores de servicios de inferencia como Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter y Together AI. También se ofrece como microservicio NVIDIA NIM para implementación segura y escalable en cualquier infraestructura acelerada por NVIDIA.

Importantes empresas como Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens, Synopsys y Zoom ya están integrando modelos de la familia Nemotron para potenciar flujos de trabajo de IA en manufactura, ciberseguridad, desarrollo de software, medios, comunicaciones y otras industrias.

Los modelos Nemotron 3 Super y Ultra estarán disponibles durante la primera mitad de 2026, completando el ecosistema de modelos abiertos para aplicaciones agentic de IA.

El futuro de la IA abierta y colaborativa

La iniciativa Nemotron representa un paso importante hacia la democratización de la IA avanzada. Al proporcionar modelos abiertos, transparentes y eficientes, NVIDIA está sentando las bases para que organizaciones de todo el mundo construyan sistemas de IA alineados con sus propios datos, regulaciones y valores.

Esta aproximación a la IA soberana permite que empresas y gobiernos mantengan el control sobre sus sistemas de IA críticos mientras se benefician de los últimos avances en tecnología de modelos. Para desarrolladores y startups, Nemotron 3 ofrece la oportunidad de construir agentes de IA sofisticados sin depender exclusivamente de soluciones propietarias, acelerando la innovación desde prototipo hasta implementación empresarial.