Gemini 3 Flash sorprende y supera a GPT-5.2 Extra High en pruebas clave de rendimiento

Inteligencia Artificial17/12/2025

En un giro inesperado dentro de la competencia por la supremacía en inteligencia artificial, Google ha presentado Gemini 3 Flash, un modelo diseñado para ser rápido y eficiente, pero que ha logrado superar en varias pruebas clave a uno de los modelos más avanzados de OpenAI: GPT-5.2 Extra High.

Durante años, se asumió que los modelos rápidos solían sacrificar capacidad de razonamiento en favor de menores tiempos de respuesta y costos. Sin embargo, Gemini 3 Flash rompe con esa lógica, demostrando que es posible combinar velocidad, escalabilidad e inteligencia sin comprometer el rendimiento.

Google sostiene que su nuevo modelo puede ajustar su nivel de procesamiento según el contexto, lo que le permite "pensar" más tiempo si la tarea lo requiere, y hacerlo con un 30% menos de tokens que su predecesor, Gemini 2.5 Pro, en tareas típicas. Este equilibrio se ha traducido en resultados destacables en múltiples benchmarks.

En SimpleQA Verified, una prueba de fiabilidad en respuestas de conocimiento, Flash alcanzó un 68,7%, frente al 38% del modelo de OpenAI. También superó a GPT-5.2 Extra High en razonamiento multimodal (81,2% vs 79,5%) y en interpretación de video (86,9% vs 85,9%). En cuanto a capacidades multilingües y culturales, obtuvo un 91,8% frente al 89,6% del modelo rival. Y en Global PIQA, que evalúa sentido común en 100 idiomas, la ventaja se mantuvo: 92,8% frente a 91,2%.

Además, Gemini 3 Flash mostró solidez en el uso de herramientas. En Toolathlon obtuvo un 49,4% frente al 46,3% de OpenAI, y en FACTS Benchmark Suite, centrado en hechos verificables, ganó con un 61,9% frente al 61,4%.

No obstante, GPT-5.2 Extra High sigue siendo superior en razonamiento puro. En pruebas más complejas como ARC-AGI-2, que involucra acertijos visuales, el modelo de OpenAI lidera con un 52,9% frente al 33,6% de Flash. También mantiene la delantera en ejecución de código (100% vs 99,7%) y en tareas de ingeniería de software con un 80% frente al 78% de Gemini.

GPT-5.2 Extra High, identificado en las API de OpenAI como “xhigh”, representa la versión con mayor capacidad de razonamiento de la compañía. Aunque no es ampliamente promocionado, es utilizado como referencia técnica en varias comparativas.

Gemini 3 Flash ya está disponible para los usuarios de la app de Gemini, y su implementación se extiende a desarrolladores mediante la API, AI Studio y Vertex AI. En Estados Unidos, incluso ha reemplazado a modelos anteriores en el modo de IA del buscador de Google.

El modelo tiene un precio de 0,50 dólares por millón de tokens de entrada y 3 dólares por millón de tokens de salida, ligeramente superior a la versión anterior, Flash 2.5.

Este nuevo escenario refuerza la idea de que la carrera por la inteligencia artificial ya no es un juego de un solo líder. La distancia entre Google y OpenAI se ha reducido drásticamente, dando paso a una competencia más cerrada, técnica y estratégica, donde cada avance redefine lo que se considera posible en el desarrollo de modelos de IA.

Gemini AI

Te puede interesar

gemini-3.1_flash_Lite_blog_keywo.width-1200.format-webp

Lo más visto

Gemini 3 Flash sorprende y supera a GPT-5.2 Extra High en pruebas clave de rendimiento

Google lanza Gemini 3.1 Flash-Lite, su modelo más rápido y económico para cargas masivas de IA

ChatGPT enfrenta ola de desinstalaciones tras acuerdo de OpenAI con el Pentágono

Claude de Anthropic sufre caídas consecutivas en medio de crisis en centros de datos de AWS

Anthropic lanza Claude Sonnet 4.6 con ventana de contexto de 1 millón de tokens y acceso gratuito

Canva transforma la ingeniería de software con agentes de IA que programan mientras los ingenieros duermen

OpenAI ficha al creador de OpenClaw para reforzar su apuesta por agentes de IA autónomos

Meta integra la IA Manus en Ads Manager y la expande a Telegram como asistente autónomo

Moonshot AI lanza Kimi Claw, versión en la nube de OpenClaw que funciona 24/7 desde el navegador

ChatGPT enfrenta ola de desinstalaciones tras acuerdo de OpenAI con el Pentágono

Bitcoin rebota hacia los 70 mil dólares, pero analistas advierten que el mercado bajista sigue intacto

Amazon lanza “canvas” con IA agéntica para vendedores en EE.UU. y Reino Unido

Google convierte Now Playing de los Pixel en aplicación independiente

Google lanza Gemini 3.1 Flash-Lite, su modelo más rápido y económico para cargas masivas de IA