Canonical ha anunciado el lanzamiento de Charmed Kubeflow 1.10, una actualización significativa de su conocida plataforma de código abierto para Operaciones de Aprendizaje Automático (MLOps).
Esta versión no solo incorpora las mejoras del proyecto base Kubeflow 1.10, sino que también añade funcionalidades propias pensadas especialmente para entornos empresariales, buscando facilitar la gestión de los flujos de trabajo de machine learning de forma más eficiente y segura.
Novedades heredadas de Kubeflow 1.10
La base de esta nueva versión se nutre de los avances del proyecto Kubeflow 1.10. Veamos algunos de los puntos clave:
Optimización avanzada de hiperparámetros con Trainer 2.0 y Katib
Una de las tareas cruciales en el entrenamiento de modelos es el ajuste de hiperparámetros. Kubeflow Trainer 2.0, en combinación con Katib, introduce mejoras para simplificar esta optimización.
Destaca una nueva API de alto nivel diseñada específicamente para el ajuste de hiperparámetros en modelos de lenguaje grandes (LLMs), lo que reduce la intervención manual y acelera los procesos de fine-tuning.
Además, Katib ahora soporta:
- Nuevos tipos de distribución de parámetros (log-uniforme, normal, log-normal).
- Un mecanismo de recolección de métricas basado en push, mejorando el rendimiento y la administración.
Mayor flexibilidad y escalabilidad en Kubeflow Pipelines
La versión 2.4.1 de Kubeflow Pipelines trae consigo mejoras importantes para la orquestación de flujos de trabajo:
- Soporte para placeholders en los límites de recursos, permitiendo configuraciones de pipeline más dinámicas y adaptables.
- Paralelismo en bucles con límites configurables, lo que facilita la ejecución masiva en paralelo manteniendo la estabilidad del sistema.
- Resolución fiable de salidas de componentes anidados (DAGs), simplificando la gestión y reutilización de pipelines complejos.
Servicio de modelos mejorado con KServe
KServe 0.14.1 introduce funcionalidades para optimizar el despliegue de modelos:
- Nuevo SDK de Python con capacidades de inferencia asíncrona.
- Integración estable con almacenamiento OCI para una gestión robusta de modelos.
- Caché de modelos que aprovecha el almacenamiento local del nodo para un despliegue más rápido de modelos grandes.
- Integración directa con Hugging Face, permitiendo el despliegue sencillo desde el Hugging Face Hub.
Un ecosistema en crecimiento
El ecosistema de Kubeflow sigue expandiéndose. Recientemente ha dado la bienvenida a la integración con Spark, y la comunidad de Feast (un popular almacén de características o feature store de código abierto) está trabajando activamente en un plan para unirse al proyecto. La combinación de Kubeflow y Feast promete una experiencia MLOps completa, especialmente útil para casos de IA Generativa y RAG (Retrieval-Augmented Generation).
El valor añadido de canonical en Charmed Kubeflow 1.10
Canonical no se limita a empaquetar los componentes base. La empresa se enfoca en proporcionar una experiencia pulida para despliegues en producción, desarrollando soluciones de código abierto para mejorar la orquestación e integración.
Gestión simplificada con GitOps
Se ha añadido una forma automatizada y simplificada para gestionar los perfiles de Kubeflow mediante GitOps, gracias al nuevo charm Github Profile Automator. Este mecanismo permite definir declarativamente los perfiles en un único lugar, sentando las bases para futuras integraciones con proveedores de identidad externos.
Mayor resiliencia y alta disponibilidad
Ahora se ofrece una opción de alta disponibilidad para el ingress de Istio. Esto mejora la resiliencia de los despliegues, asegurando que la plataforma pueda manejar un alto volumen de tráfico de manera fiable.
Monitorización mejorada
Se han incorporado más puntos de control de salud (health-checks) y reglas de alerta para componentes como KServe e Istio. Con cada versión, Canonical busca ofrecer más herramientas para supervisar el estado del despliegue.
Seguridad reforzada
La seguridad es una prioridad. La mayoría de las imágenes de contenedor usadas en Charmed Kubeflow ahora se basan en Ubuntu y la tecnología Rocks de Canonical, aprovechando sus procesos de aplicación de parches de seguridad para minimizar las vulnerabilidades (CVEs).
Integración en el ecosistema AI/ML de Canonical
Charmed Kubeflow está diseñado para funcionar sobre cualquier distribución de Kubernetes certificada por la CNCF, ofreciendo flexibilidad a la hora de elegir el entorno.
Canonical también está trabajando en ofrecer Kubeflow como un servicio gestionado en la nube pública, lo que reduciría significativamente el tiempo de despliegue y los costes operativos. Para los científicos de datos que deseen experimentar localmente, el Data Science Stack de Canonical ofrece una solución lista para usar en portátiles o estaciones de trabajo Ubuntu. Además, se está desarrollando una solución independiente de servicio de modelos sobre Kubernetes, pensada para despliegues críticos y seguros, incluso en el edge.
Primeros pasos con Charmed Kubeflow 1.10
Tanto si eres un experto en MLOps como si estás empezando con Kubeflow, esta nueva versión ofrece mejoras sustanciales. Puedes explorar los detalles completos y las instrucciones de instalación en las notas de la versión de Canonical. Para soporte empresarial o servicios gestionados, puedes contactar directamente con Canonical.