Gemini 3 Flash sorprende y supera a GPT-5.2 Extra High en pruebas clave de rendimiento

Inteligencia Artificial17/12/2025Industrial InsiderIndustrial Insider
geminiiagoogle_6684589_20240208154244

En un giro inesperado dentro de la competencia por la supremacía en inteligencia artificial, Google ha presentado Gemini 3 Flash, un modelo diseñado para ser rápido y eficiente, pero que ha logrado superar en varias pruebas clave a uno de los modelos más avanzados de OpenAI: GPT-5.2 Extra High.

Durante años, se asumió que los modelos rápidos solían sacrificar capacidad de razonamiento en favor de menores tiempos de respuesta y costos. Sin embargo, Gemini 3 Flash rompe con esa lógica, demostrando que es posible combinar velocidad, escalabilidad e inteligencia sin comprometer el rendimiento.

Google sostiene que su nuevo modelo puede ajustar su nivel de procesamiento según el contexto, lo que le permite "pensar" más tiempo si la tarea lo requiere, y hacerlo con un 30% menos de tokens que su predecesor, Gemini 2.5 Pro, en tareas típicas. Este equilibrio se ha traducido en resultados destacables en múltiples benchmarks.

En SimpleQA Verified, una prueba de fiabilidad en respuestas de conocimiento, Flash alcanzó un 68,7%, frente al 38% del modelo de OpenAI. También superó a GPT-5.2 Extra High en razonamiento multimodal (81,2% vs 79,5%) y en interpretación de video (86,9% vs 85,9%). En cuanto a capacidades multilingües y culturales, obtuvo un 91,8% frente al 89,6% del modelo rival. Y en Global PIQA, que evalúa sentido común en 100 idiomas, la ventaja se mantuvo: 92,8% frente a 91,2%.

Además, Gemini 3 Flash mostró solidez en el uso de herramientas. En Toolathlon obtuvo un 49,4% frente al 46,3% de OpenAI, y en FACTS Benchmark Suite, centrado en hechos verificables, ganó con un 61,9% frente al 61,4%.

No obstante, GPT-5.2 Extra High sigue siendo superior en razonamiento puro. En pruebas más complejas como ARC-AGI-2, que involucra acertijos visuales, el modelo de OpenAI lidera con un 52,9% frente al 33,6% de Flash. También mantiene la delantera en ejecución de código (100% vs 99,7%) y en tareas de ingeniería de software con un 80% frente al 78% de Gemini.

GPT-5.2 Extra High, identificado en las API de OpenAI como “xhigh”, representa la versión con mayor capacidad de razonamiento de la compañía. Aunque no es ampliamente promocionado, es utilizado como referencia técnica en varias comparativas.

Gemini 3 Flash ya está disponible para los usuarios de la app de Gemini, y su implementación se extiende a desarrolladores mediante la API, AI Studio y Vertex AI. En Estados Unidos, incluso ha reemplazado a modelos anteriores en el modo de IA del buscador de Google.

El modelo tiene un precio de 0,50 dólares por millón de tokens de entrada y 3 dólares por millón de tokens de salida, ligeramente superior a la versión anterior, Flash 2.5.

Este nuevo escenario refuerza la idea de que la carrera por la inteligencia artificial ya no es un juego de un solo líder. La distancia entre Google y OpenAI se ha reducido drásticamente, dando paso a una competencia más cerrada, técnica y estratégica, donde cada avance redefine lo que se considera posible en el desarrollo de modelos de IA.
 
 
 

Te puede interesar
Lo más visto