Noticias IA

Comparativa de modelos de IA — calidad, precio y open source

Los principales modelos de IA de EE.UU., Europa y China, comparados por calidad (benchmarks de mercado), coste en dólares por millón de tokens y si son open source.

Datos a 2026-06-25 · investigación automática (Artificial Analysis, LMArena, precios oficiales) — verificar antes de decidir.

🏆 Calidad (desarrollo SW + arena)

ModeloCalidadSWE-bench-ProLiveCodeBenchTerminal-BenchGPQAARC-AGI-2LMArena
🇺🇸 Claude Opus 4.8Anthropic · USA65.469.274.684141455
🇺🇸 GPT-5.5OpenAI · USA63.558.682.785161445
🇨🇳 DeepSeek V4-ProDeepSeek · China60.515.5683.339.68291465
🇺🇸 Gemini 3.1 ProGoogle · USA59.954.268.584151470
🇨🇳 GLM-5.2Zhipu AI · China55.482.840.57871450
🇺🇸 Grok 4.3xAI · USA49.379.484161445
🇺🇸 MAI-Thinking-1Microsoft · USA48.752.887.746.084.2
🇺🇸 Claude Sonnet 4.6Anthropic · USA41.959.18091430
🇺🇸 Llama 4 MaverickMeta · USA40.743.47051420
🇨🇳 Qwen3.7-MaxAlibaba · China33.18171480
🇨🇳 Kimi K2.6Moonshot AI · China32.87891460
🇪🇺 Mistral Large 3 (25.12)Mistral AI · Europa32.27261410
🇪🇺 Magistral Small 1.2Mistral AI · Europa21.270.8870.074

Calidad = índice propio (0-100) que pondera SWE-bench-Pro y LiveCodeBench (desarrollo SW), Terminal-Bench (control del SO), LMArena (preferencia humana) y GPQA; ARC-AGI-2 NO entra en el índice (es solo indicativo). ARC-AGI-2 (arcprize.org) mide progreso hacia AGI: los modelos puntúan MUY bajo → aún lejos de AGI. %, salvo LMArena (Elo).

💵 Economía (USD / 1M tokens)

ModeloInputCacheOutput
🇺🇸 Claude Opus 4.8Anthropic · USA$5.0$0.5$25.0
🇺🇸 GPT-5.5OpenAI · USA$5.0$0.5$30.0
🇨🇳 DeepSeek V4-ProDeepSeek · China$0.28$0.03$0.87
🇺🇸 Gemini 3.1 ProGoogle · USA$1.25$0.31$10.0
🇨🇳 GLM-5.2Zhipu AI · China$0.6$0.11$2.2
🇺🇸 Grok 4.3xAI · USA$3.0$0.75$15.0
🇺🇸 MAI-Thinking-1Microsoft · USA
🇺🇸 Claude Sonnet 4.6Anthropic · USA$3.0$0.3$15.0
🇺🇸 Llama 4 MaverickMeta · USA$0.2$0.6
🇨🇳 Qwen3.7-MaxAlibaba · China$1.2$0.6$6.0
🇨🇳 Kimi K2.6Moonshot AI · China$0.6$0.15$2.5
🇪🇺 Mistral Large 3 (25.12)Mistral AI · Europa$2.0$6.0
🇪🇺 Magistral Small 1.2Mistral AI · Europa$0.5$1.5

🔓 Open source y variedad

ModeloOpen sourceLicenciaVariedad
🇺🇸 Claude Opus 4.8Anthropic · USANoPropietarioPropietario (solo API)
🇺🇸 GPT-5.5OpenAI · USANoPropietarioPropietario (solo API)
🇨🇳 DeepSeek V4-ProDeepSeek · ChinaMITOpen-weight (pesos abiertos)
🇺🇸 Gemini 3.1 ProGoogle · USANoPropietarioPropietario (solo API)
🇨🇳 GLM-5.2Zhipu AI · ChinaMITOpen-weight (pesos abiertos)
🇺🇸 Grok 4.3xAI · USANoPropietarioPropietario (solo API)
🇺🇸 MAI-Thinking-1Microsoft · USANoPropietarioPropietario (solo API)
🇺🇸 Claude Sonnet 4.6Anthropic · USANoPropietarioPropietario (solo API)
🇺🇸 Llama 4 MaverickMeta · USALlama 4 CommunityOpen-weight (pesos abiertos)
🇨🇳 Qwen3.7-MaxAlibaba · ChinaNoPropietarioPropietario (solo API)
🇨🇳 Kimi K2.6Moonshot AI · ChinaModified MITOpen-weight (pesos abiertos)
🇪🇺 Mistral Large 3 (25.12)Mistral AI · EuropaMistral Research License (no comercial)Open-weight (pesos abiertos)
🇪🇺 Magistral Small 1.2Mistral AI · EuropaApache-2.0Open-weight (pesos abiertos)

🖥️ Open source para tu hardware

Pequeños/medianos que corren en local. Memoria estimada en cuantización 4-bit (Q4) y 8-bit (Q8); en Apple Silicon es memoria UNIFICADA (RAM=VRAM).

ModeloCalidadSWE-bench-ProLiveCodeBenchGPQAParamsRAM Q4RAM Q8GPU (VRAM)CPU / MacLicencia
Gemma 3 27BGoogle29.629.724.327B16 GB31 GB≥16 GBLimitado (mejor GPU/Mac ≥32 GB)Gemma
Qwen3-32BAlibaba19.060.668.432.8B20 GB38 GB≥24 GBLimitado (mejor GPU/Mac ≥32 GB)Apache-2.0
Qwen3-8BAlibaba18.460.363.38.2B6 GB11 GB≥8 GBSí (CPU/Mac, fluido)Apache-2.0
DeepSeek-R1-Distill-Qwen-14BDeepSeek16.553.159.114B9 GB17 GB≥12 GBSí (CPU lento · Mac 16 GB)MIT
Phi-4Microsoft5.656.114.7B10 GB18 GB≥12 GBSí (CPU lento · Mac 16 GB)MIT
Mistral Small 3Mistral AI4.545.324B15 GB28 GB≥16 GBLimitado (mejor GPU/Mac ≥32 GB)Apache-2.0
Llama 3.1 8BMeta3.030.48B6 GB10 GB≥8 GBSí (CPU/Mac, fluido)Llama 3.1 Community
Gemma 3 12BGoogle2.525.412B8 GB15 GB≥8 GBSí (CPU lento · Mac 16 GB)Gemma
Gemma 3 4BGoogle1.515.04B4 GB6 GB≥8 GBSí (CPU/Mac, fluido)Gemma