Gemini 2.5 Flash: La nueva IA de Google con "Presupuesto de razonamiento"

Google sigue apostando fuerte por la inteligencia artificial y acaba de presentar una nueva versión de su modelo más ágil: Gemini 2.5 Flash.

Disponible en versión preliminar a través de la API Gemini (en Google AI Studio y Vertex AI), esta actualización representa un salto importante respecto a la versión 2.0 Flash, sobre todo en su capacidad de razonamiento, sin dejar de lado la velocidad y la eficiencia en costes que caracterizan a esta familia.

¿Qué son los modelos con capacidad de razonamiento?

Una de las claves de los modelos Gemini 2.5, incluido Flash, es su habilidad para "pensar" antes de responder. En lugar de generar una salida de forma inmediata, estos modelos pueden llevar a cabo un proceso interno de reflexión para comprender mejor la petición (el famoso prompt), descomponer tareas complejas y planificar la respuesta más adecuada.

Este enfoque es especialmente útil en tareas que requieren varios pasos lógicos, como resolver problemas matemáticos complejos o analizar preguntas de investigación. Gracias a este proceso de "pensamiento" previo, el modelo puede ofrecer respuestas más precisas y completas. De hecho, Google destaca que Gemini 2.5 Flash obtiene buenos resultados en pruebas exigentes como Hard Prompts en LMArena, solo superado por su hermano mayor, 2.5 Pro.

Gemini 2.5 Flash: Un modelo híbrido y flexible

La gran novedad de Gemini 2.5 Flash es su naturaleza híbrida. Es el primer modelo de Google que permite a los desarrolladores activar o desactivar explícitamente esta capacidad de razonamiento. Pero la flexibilidad no termina ahí.

El "Presupuesto de Razonamiento"

Se introduce el concepto de "presupuesto de razonamiento" (thinking budget). Esto permite a los desarrolladores establecer un límite máximo de "pensamiento" (medido en tokens) que el modelo puede emplear.

Un presupuesto más alto permite al modelo dedicar más recursos a razonar, lo que potencialmente mejora la calidad de la respuesta en tareas complejas.
Un presupuesto más bajo prioriza la velocidad y reduce el coste, manteniendo un buen rendimiento.

Es importante destacar que el modelo no siempre consume todo el presupuesto asignado. Está entrenado para evaluar la complejidad de la petición y usar solo el razonamiento necesario. Si la tarea es sencilla, apenas "pensará", aunque el presupuesto sea alto.

Control total para el desarrollador

Esta capacidad de ajuste fino ofrece un gran control:

Presupuesto 0: Si se busca la máxima velocidad y el mínimo coste, se puede establecer el presupuesto a cero. Aun así, Google afirma que el rendimiento mejora respecto a la versión 2.0 Flash.
Presupuesto ajustable: Se puede definir un presupuesto específico (hasta 24576 tokens para 2.5 Flash) mediante un parámetro en la API o un deslizador en las interfaces de Google AI Studio y Vertex AI.

Esto permite adaptar el comportamiento del modelo a las necesidades específicas de cada aplicación, encontrando el equilibrio perfecto entre calidad, latencia y coste.

Rendimiento y coste: Una combinación atractiva

Google posiciona a Gemini 2.5 Flash como un modelo con métricas comparables a otros modelos líderes del mercado, pero con un coste y tamaño significativamente menores. Sigue destacando por ofrecer una de las mejores relaciones entre rendimiento y precio del panorama actual.

Ejemplos de uso del razonamiento

El modelo ajusta automáticamente su nivel de razonamiento. Algunos ejemplos según la complejidad:

Bajo razonamiento: Traducir "Gracias" al español, preguntar cuántas provincias tiene Canadá.
Medio razonamiento: Calcular la probabilidad de sumar 7 al lanzar dos dados, crear un horario complejo que combine trabajo y ocio según restricciones específicas.
Alto razonamiento: Calcular la tensión máxima de flexión en una viga bajo cargas específicas (problema de ingeniería), escribir una función de código para evaluar celdas en una hoja de cálculo con dependencias y precedencia de operadores.

Primeros pasos con Gemini 2.5 Flash

Los desarrolladores interesados ya pueden empezar a experimentar con esta versión preliminar de Gemini 2.5 Flash a través de la API Gemini, accesible desde Google AI Studio y la plataforma Vertex AI. Es una oportunidad para explorar las nuevas capacidades de razonamiento ajustable y ver cómo pueden mejorar sus propias aplicaciones.