OpenAI y Broadcom presentan Jalapeño, el primer chip de inferencia propio de OpenAI optimizado para LLMs

El 24 de junio de 2026, OpenAI y Broadcom (NASDAQ: AVGO) anunciaron oficialmente Jalapeño, el primer procesador de inteligencia ('Intelligence Processor') diseñado íntegramente por OpenAI.

El 24 de junio de 2026, OpenAI y Broadcom (NASDAQ: AVGO) anunciaron oficialmente Jalapeño, el primer procesador de inteligencia ('Intelligence Processor') diseñado íntegramente por OpenAI. Se trata de un acelerador de hardware concebido desde cero para la inferencia de modelos de lenguaje de gran tamaño (LLMs), y constituye el punto de partida de una plataforma de cómputo de múltiples generaciones que ambas compañías desarrollarán conjuntamente. El anuncio marca un hito en la estrategia de OpenAI de controlar toda la cadena de valor de la IA, desde los modelos y los productos hasta el silicio que los ejecuta.

El chip fue entregado físicamente por Hock Tan, presidente y CEO de Broadcom, y Charlie Kawwas, presidente de Broadcom, a Sam Altman, CEO de OpenAI, y Greg Brockman, presidente y cofundador de la compañía. Este acto simbólico subraya la importancia estratégica del acuerdo: OpenAI deja de depender exclusivamente de aceleradores de terceros —léase NVIDIA— y pasa a tener voz propia en la capa de silicio que sustenta sus modelos y productos.

**Un diseño en blanco para inferencia LLM, no una adaptación**

Uno de los mensajes más llamativos del comunicado oficial es que Jalapeño no es un acelerador de propósito general adaptado a cargas de trabajo de IA, como suele ocurrir con muchas soluciones del mercado. Es, en palabras de la propia OpenAI, un 'diseño en blanco' ('blank-slate design') construido alrededor de los requerimientos específicos de la inferencia moderna de LLMs. Esto significa que cada decisión arquitectónica —cómo se mueven los datos, cómo se equilibran cómputo, memoria y red, cómo se organizan los kernels— ha sido informada por el conocimiento profundo que OpenAI ha acumulado ejecutando ChatGPT, Codex, la API y sus futuros productos agénticos a escala de producción real.

Richard Ho, responsable del programa de hardware de OpenAI, explicó que el chip fue optimizado en torno a los kernels, el movimiento de memoria, las redes de interconexión y los patrones de serving que más importan para los modelos frontera. El objetivo declarado es que la arquitectura permita una utilización real muy cercana al rendimiento teórico máximo del hardware, reduciendo la brecha entre lo que el chip puede hacer en teoría y lo que realmente ejecuta bajo cargas de producción. Esta brecha —conocida en el sector como 'utilization gap'— es uno de los problemas crónicos de los aceleradores de propósito general aplicados a LLMs.

**Nueve meses de tape-out: un récord en semiconductores de alto rendimiento**

Quizás el dato más sorprendente del anuncio es la velocidad de desarrollo: Jalapeño pasó del diseño inicial al tape-out (envío a fabricación) en tan solo nueve meses. OpenAI afirma que esto representa lo que creen es el ciclo de desarrollo ASIC más rápido jamás logrado en semiconductores avanzados de alto rendimiento. Para contextualizar, los ciclos típicos de diseño de chips complejos suelen durar entre dos y cuatro años.

Esa velocidad no fue fruto solo de la experticia humana. OpenAI utilizó sus propios modelos de IA para acelerar partes del proceso de diseño y optimización del chip. Hay aquí una recursividad significativa: los mismos modelos que se sirven a los usuarios ayudaron a mejorar la infraestructura que ejecutará los modelos futuros. OpenAI lo enmarca como una prueba del potencial de la IA para democratizar el acceso al cómputo avanzado: si la IA puede ayudar a los ingenieros a diseñar mejores chips más rápido, eso reduce el coste del cómputo en toda la industria.

**Rendimiento: mejor eficiencia energética que el estado del arte actual**

Las muestras de ingeniería del chip Jalapeño ya están ejecutando cargas de trabajo de ML en laboratorio a la frecuencia y potencia objetivo de producción, incluido GPT-5.3-Codex-Spark. Los primeros resultados muestran que Jalapeño ofrecerá un rendimiento por vatio ('performance per watt') sustancialmente mejor que el estado del arte actual. OpenAI aclara que todavía está midiendo el rendimiento final y que presentará un informe técnico detallado en los próximos meses, por lo que los números concretos no se han publicado aún.

Esta métrica —rendimiento por vatio— es crucial en el contexto actual. Con los centros de datos consumiendo gigavatios de electricidad para entrenar e inferir modelos de IA, mejorar la eficiencia energética no es solo un argumento comercial, sino también una necesidad operativa y ambiental. Si Jalapeño cumple lo prometido, podría reducir significativamente el coste energético de servir inteligencia a escala.

**Arquitectura orientada a reducir el movimiento de datos**

Sin entrar en detalles técnicos exhaustivos —que se reservan para el informe técnico futuro—, el comunicado destaca que la arquitectura de Jalapeño está diseñada para reducir el movimiento de datos y equilibrar los recursos de cómputo, memoria y red. Este enfoque es coherente con la literatura técnica reciente sobre inferencia de LLMs, donde el cuello de botella habitual no es la capacidad de cómputo bruta sino el ancho de banda de memoria y la latencia de comunicación entre chips.

La arquitectura busca combinar la potencia y el throughput de los mejores aceleradores de IA actuales con una latencia cercana a la de los sistemas de inferencia especializada más rápidos. Esto convierte a Jalapeño en una propuesta especialmente adecuada para productos LLM interactivos a escala —exactamente el tipo de carga que ChatGPT, Codex y las API de OpenAI generan todos los días.

**El ecosistema de socios: Broadcom y Celestica**

OpenAI no ha desarrollado Jalapeño en solitario. Broadcom ha aportado su experiencia en implementación de silicio, incluyendo sus tecnologías de networking Tomahawk, que ayudan a llevar la plataforma a producción a gran escala. Celestica, por su parte, es el socio responsable de la integración de placas, racks y sistemas, así como de los sistemas de producción escalables.

Esta división de roles es reveladora: OpenAI se reserva el diseño arquitectónico del chip (la 'visión' del producto), mientras externaliza la implementación física del silicio y la ingeniería de sistemas a socios con décadas de experiencia. Es un modelo que recuerda al de Apple con sus chips de la serie M —donde Apple diseña y TSMC fabrica— pero aplicado al mundo de los aceleradores de IA para centros de datos.

**Despliegue a escala de gigavatios con Microsoft y otros socios**

Hock Tan afirmó en el comunicado que la colaboración con OpenAI representa 'un compromiso fundamental con escalar la infraestructura física requerida para la próxima década de IA' y que el despliegue de centros de datos a escala de gigavatios con Microsoft y otros socios comenzará en 2026. Esta mención explícita a Microsoft —principal inversor y socio de infraestructura de OpenAI— sugiere que Jalapeño se integrará en los centros de datos que Azure despliega para soportar los servicios de OpenAI.

El concepto de 'gigawatt scale' merece atención: estamos hablando de centros de datos cuya demanda energética total se mide en gigavatios, una escala que solo unos pocos hiperescaladores en el mundo están alcanzando o planificando. Esto sitúa a OpenAI en una liga muy exclusiva de empresas capaces de diseñar y desplegar infraestructura de IA a esa magnitud.

**La estrategia de pila completa ('full-stack') de OpenAI**

Jalapeño es, ante todo, una declaración estratégica. OpenAI lleva años construyendo hacia arriba —modelos cada vez más capaces, productos cada vez más sofisticados— y ahora está construyendo también hacia abajo, hacia el silicio. Greg Brockman lo articula con claridad: 'El mundo se está moviendo hacia una economía impulsada por el cómputo. Jalapeño es parte de nuestra estrategia de infraestructura full-stack a largo plazo para hacer el cómputo más abundante'.

Esta lógica de pila completa es el mismo argumento que usó Apple cuando diseñó sus propios chips para Mac e iPhone: controlando el hardware y el software, puedes optimizar cada capa alrededor del mismo objetivo y lograr eficiencias imposibles cuando dependes de componentes de terceros diseñados para casos de uso genéricos. En el caso de OpenAI, cada capa —arquitectura del chip, kernels, sistemas de memoria, networking, scheduling, sistemas de despliegue, experiencia de producto— puede ser optimizada alrededor de un objetivo único: hacer sus modelos más rápidos, más fiables y más asequibles para los usuarios.

**El volante de inercia estratégico**

El comunicado describe explícitamente un 'flywheel' o volante de inercia: una mejor infraestructura impulsa la eficiencia computacional; mayor eficiencia computacional permite mejor entrenamiento y serving, lo que potencia modelos de IA más capaces; mejores modelos se convierten en mejores productos para personas, desarrolladores y empresas; mejores productos generan más uso, más clientes y más ingresos, que permiten a OpenAI reinvertir en la próxima generación de infraestructura. Con el tiempo, ese ciclo ayuda a hacer la inteligencia más capaz, más fiable y menos costosa para todos.

Este argumento es poderoso porque convierte la inversión en chips propios en una palanca de competitividad compuesta: no es solo ahorro en costes de hardware, sino una aceleración de todo el ciclo de mejora de modelos y productos.

**Diseñado también para toda la industria LLM, no solo para OpenAI**

Un detalle notable es que Jalapeño se presenta no solo como infraestructura para los modelos propios de OpenAI, sino como una plataforma diseñada para servir 'LLMs actuales y futuros de toda la industria'. Esto sugiere que OpenAI podría eventualmente ofrecer acceso a esta infraestructura a terceros, bien a través de su API, bien a través de acuerdos específicos con otras organizaciones. Es una extensión lógica de su modelo de negocio: si el chip es eficiente para cualquier LLM, OpenAI puede posicionarse como proveedor de infraestructura de inferencia para el ecosistema, no solo para sus propios modelos.

**El impacto en los usuarios finales**

OpenAI es explícita en conectar la mejora técnica con el beneficio al usuario. Cada mejora en coste, velocidad y fiabilidad puede traducirse en: respuestas más rápidas en ChatGPT, tareas de Codex que pueden ejecutar más pasos con menos espera, productos de API más baratos de construir, o acceso más estable cuando la demanda es alta. La democratización de la IA, en su visión, requiere que los modelos avanzados sean accesibles, fiables y asequibles para estudiantes, desarrolladores, pequeñas empresas, investigadores y cualquier persona que intente aprender, crear o resolver problemas difíciles.

**Contexto competitivo**

El lanzamiento de Jalapeño se produce en un contexto de intensa competencia en el mercado de chips de IA. NVIDIA sigue dominando el entrenamiento y la inferencia de LLMs con sus GPUs H100 y B200. Google tiene sus TPUs (Tensor Processing Units), que lleva años usando internamente. Amazon tiene sus chips Trainium e Inferentia. Microsoft ha anunciado sus propios aceleradores Maia. Meta está desarrollando chips propios. Y varios startups especializados en inferencia, como Groq, también compiten en este espacio.

Lo que diferencia a Jalapeño es la combinación de tres factores: el diseño desde cero para LLM inference (no una adaptación), la integración vertical con los modelos y sistemas de OpenAI, y la escala de despliegue prevista. La afirmación de que el chip se ejecutará a escala de gigavatios con Microsoft desde 2026 lo sitúa inmediatamente en el primer plano del mercado de infraestructura de IA.

**Señales de madurez institucional**

El hecho de que OpenAI haya podido ejecutar un programa de ASIC de alto rendimiento en nueve meses —involucrando diseño arquitectónico, co-desarrollo software-hardware, integración con socios como Broadcom y Celestica, y pruebas de ingeniería con cargas reales de producción— es una señal de madurez institucional significativa. OpenAI ha dejado de ser exclusivamente una organización de investigación o incluso una empresa de software: es ahora un actor de hardware a escala industrial.

La participación de OpenAI's models en el propio proceso de diseño del chip es también una prueba de concepto relevante para el mundo de la IA agéntica: si los modelos de IA pueden acelerar ciclos de diseño de semiconductores —uno de los dominios más complejos y especializados de la ingeniería—, el alcance de la automatización asistida por IA en el trabajo de conocimiento avanzado es mucho más amplio de lo que muchos asumen.

**Lo que todavía no sabemos**

El comunicado es deliberadamente escueto en cifras concretas. No se publican benchmarks específicos, consumo en vatios, número de parámetros que puede manejar, latencia en tokens por segundo, ni precio por chip o por unidad de cómputo. OpenAI promete un informe técnico detallado en los próximos meses. Hasta que ese informe se publique, las afirmaciones sobre 'rendimiento por vatio sustancialmente mejor que el estado del arte' deben tomarse como declaraciones de intención verificables en el futuro, no como hechos probados externamente.

Tampoco está claro si Jalapeño sustituirá o complementará a los aceleradores NVIDIA en la infraestructura de OpenAI. Lo más probable, dada la escala de su dependencia de GPUs NVIDIA y los contratos existentes, es que ambos coexistan durante años, con Jalapeño tomando progresivamente más carga de trabajo de inferencia.

**Conclusión: el inicio de una nueva era para OpenAI**

Jalapeño es más que un chip: es el primer paso tangible de la estrategia de OpenAI para controlar su propio destino computacional. En un sector donde el acceso al cómputo es el recurso más escaso y más caro, diseñar tu propio silicio es la apuesta más ambiciosa que puede hacer una empresa de IA. Si funciona como promete, Jalapeño puede convertirse en una ventaja competitiva duradera —no solo en costes, sino en velocidad de innovación y capacidad de ofrecer inteligencia más asequible a más personas. La próxima prueba será el informe técnico y los datos reales de despliegue en 2026.

OpenAI y Broadcom presentan Jalapeño, el primer chip de inferencia propio de OpenAI optimizado para LLMs

Fuentes y referencias de la noticia