Groq capta 650 millones de dólares para convertirse en la nube de inferencia IA líder del mundo

El 22 de junio de 2026, Groq publicó en su sala de prensa el anuncio oficial de una ronda de crecimiento de 650 millones de dólares, liderada por los fondos Disruptive e Infinitum, con la participación adicional de inversores existentes que decidieron reinvertir en la compañía. El objetivo declarado es acelerar la expansión de su nube de inferencia de IA a escala global. Se trata de una de las apuestas más claras y directas que hemos visto hasta la fecha en el segmento de infraestructura de inferencia: una empresa que no pretende competir en entrenamiento de modelos, sino especializarse por completo en el lado de la ejecución, que es donde el grueso del tráfico productivo de IA terminará concentrándose.

Groq fue fundada en 2016 con un propósito específico: acelerar la inferencia de modelos de inteligencia artificial. Para lograrlo, la empresa diseñó desde cero su propia arquitectura de chip, la LPU (Language Processing Unit), concebida para ejecutar modelos de lenguaje de gran tamaño de forma más rápida y con menor coste que las GPU convencionales. Esta apuesta diferencial ha tardado años en materializarse en escala operativa real, pero los números que se desprenden del comunicado son ya significativos: 13 centros de datos operativos repartidos entre América del Norte, Europa, Oriente Medio y Asia-Pacífico, más de cinco millones de desarrolladores activos en su plataforma GroqCloud y el procesamiento de billones de tokens de IA cada semana.

El hito estratégico que reorientó la trayectoria reciente de la compañía fue la firma, en diciembre de 2025, de un acuerdo de licencia no exclusivo con NVIDIA. Este movimiento podría haberse interpretado inicialmente como una señal de debilidad o de convergencia con el ecosistema dominante; sin embargo, el comunicado lo enmarca exactamente al revés. En el GTC de 2026, NVIDIA anunció su plataforma de próxima generación, denominada LPX, incorporando la tecnología de inferencia de Groq. Es decir, en lugar de ser absorbida o marginada por el gigante de los chips, Groq logró que su tecnología quedara integrada en el hardware de referencia del sector. Esto no es un detalle menor: sugiere que la arquitectura LPU ha demostrado suficiente valor diferencial como para que el líder absoluto del mercado de aceleradores opte por licenciarla en lugar de replicarla internamente.

A raíz de estos dos hitos —el acuerdo de licencia con NVIDIA y el lanzamiento del LPX en GTC 2026— el consejo de administración y los inversores principales trabajaron junto con el equipo directivo para afinar el foco estratégico de la compañía en torno a una única prioridad: construir la nube de inferencia de IA líder en el mundo. Esta claridad de propósito, más fácil de enunciar que de ejecutar, se refleja también en la reestructuración del equipo de liderazgo que acompaña la ronda.

En cuanto al equipo directivo, el comunicado presenta una composición que combina perfiles complementarios y poco habituales en este tipo de empresa. Alex Davis, presidente del consejo y fundador y CEO de Disruptive (uno de los inversores líderes de la ronda), ejerce como chairman. Adam Winter, CEO de la compañía, y Matt Eng, CFO, son líderes con larga trayectoria interna en Groq que han supervisado la construcción de la tecnología, la infraestructura y las operaciones comerciales. A ellos se suma Alan Rice como Chief Operating Officer, procedente de xAI (ahora denominada SpaceXAI) y anteriormente de Meta Datacenters, con una carrera que arranca en operaciones de submarinos nucleares de la Marina de los Estados Unidos. Este último punto no es anecdótico: la gestión de infraestructuras críticas a alta presión, con márgenes de error mínimos y procesos de ingeniería muy disciplinados, es exactamente el tipo de experiencia operativa que una nube de inferencia a escala necesita cuando compite en disponibilidad, latencia y coste.

A partir de julio de 2026 se incorporan también Sinclair Schuller como Chief Technology Officer y Rakesh Malhotra como Chief Product Officer. Ambos son socios de larga data: Schuller fundó Apprenda, una plataforma empresarial en la nube que posteriormente vendió a Atos; más tarde co-fundaron juntos Nuvalence, una firma de ingeniería de software y transformación digital que fue adquirida por EY en 2024. Malhotra, por su parte, pasó aproximadamente una década en Microsoft liderando productos de nube, gestión de centros de datos y almacenamiento empresarial. La combinación de un fundador de plataformas cloud empresariales y un veterano de producto en Microsoft refuerza la hipótesis de que Groq está preparando una ofensiva comercial hacia el segmento enterprise, donde el diferencial de latencia y coste por token puede traducirse en propuestas de valor muy concretas y medibles.

El plan de expansión de infraestructura es ambicioso pero acotado en el tiempo. La compañía pretende escalar hacia 200 megavatios de capacidad instalada antes de finales de 2027. El capital recién captado se destinará principalmente a equipar y poner en producción los centros de datos existentes con la tecnología de inferencia más reciente, incluyendo el nuevo sistema LPX de NVIDIA. Este dato merece atención: en lugar de construir nueva infraestructura desde cero, Groq está acelerando el despliegue de tecnología en ubicaciones ya operativas, lo que implica un ciclo de time-to-market más corto y un perfil de riesgo operativo más controlado.

El comunicado articula con claridad la tesis de inversión que subyace a toda la operación. John Yetimoglu, miembro del consejo y fundador de Infinitum, lo expresa de forma directa: la inferencia se convertirá en el mayor mercado de infraestructura tecnológica. El argumento cuantitativo que se ofrece es que, a largo plazo, la inferencia requerirá un estimado de 15 a 20 veces más cómputo que el entrenamiento. Esta estimación, aunque no está atribuida a una fuente externa específica en el texto, es coherente con análisis ampliamente citados en el sector: el entrenamiento de un modelo es un proceso finito y relativamente concentrado en el tiempo, mientras que la inferencia se repite miles de millones de veces al día por cada usuario, aplicación o agente que consuma ese modelo en producción.

Lo que hace especialmente relevante este argumento en el momento actual es que la mayoría de los grandes proveedores cloud —AWS, Azure, Google Cloud— construyeron su infraestructura de aceleración de IA orientada principalmente al entrenamiento. Las GPU de alta densidad de memoria, los clústeres de alta velocidad de interconexión y los sistemas de almacenamiento distribuido que se optimizaron para el ciclo de entrenamiento no son necesariamente los más eficientes para servir inferencia en tiempo real a millones de peticiones concurrentes. Groq sostiene que esta brecha es su oportunidad y que ninguna empresa lidera todavía de forma clara la categoría de inferencia. Si esa afirmación es correcta, el momento presente es una ventana estratégica que puede cerrarse en los próximos dos o tres años, lo que explica la urgencia y el tamaño de la ronda.

Desde la perspectiva del ecosistema de IA agéntica, la apuesta de Groq tiene implicaciones directas. Los sistemas de agentes autónomos, los flujos de trabajo multi-agente y las aplicaciones de razonamiento en cadena (chain-of-thought) que caracterizan a los frameworks agénticos modernos son extraordinariamente intensivos en tokens: generan muchas más llamadas al modelo por interacción de usuario que una interfaz conversacional simple. Esto significa que la sensibilidad al coste por token y a la latencia de respuesta es mucho mayor en cargas de trabajo agénticas que en chat convencional. Una infraestructura de inferencia especializada, más rápida y más barata por token, es un habilitador estructural para que la IA agéntica sea económicamente viable a escala.

La decisión de NVIDIA de incorporar tecnología Groq en su plataforma LPX, si se confirma en despliegues reales, también tiene implicaciones de segundo orden interesantes. Sugiere que el mercado de infraestructura de inferencia podría evolucionar hacia una coexistencia de arquitecturas especializadas bajo un mismo paraguas de plataforma, en lugar de una convergencia completa hacia un único tipo de chip. Los operadores de centros de datos y los proveedores cloud podrían terminar configurando racks heterogéneos, combinando capacidades de GPU para entrenamiento y fine-tuning con LPUs para servicio de inferencia en producción, todo ello gestionado bajo APIs y abstracciones de orquestación comunes.

En cuanto al posicionamiento competitivo, Groq no menciona directamente a sus competidores en el comunicado, pero el contexto es conocido: AWS Trainium e Inferentia, Google TPUs, Microsoft Maia, y una larga lista de startups de chips de IA como Cerebras, SambaNova o Graphcore (ahora parte de SoftBank). A diferencia de algunos de estos actores, Groq ha optado por no fabricar y vender chips directamente a terceros, sino por operar su propia nube de inferencia como servicio. Este modelo de negocio de nube permite capturar más margen a lo largo de la cadena de valor, ofrece mayor control sobre la experiencia del desarrollador, y genera datos de uso operativo que pueden retroalimentar el desarrollo de producto; pero también requiere capital intensivo y capacidad de gestión operativa de centros de datos, que es exactamente lo que esta ronda de financiación y la nueva capa de liderazgo pretenden proporcionar.

El perfil de los cinco millones de desarrolladores que ya utilizan GroqCloud es otro dato relevante. Una base de desarrolladores amplia es un activo de distribución difícil de replicar: los desarrolladores que construyen sobre una API tienden a crear dependencias técnicas, acumulan experiencia con los modelos disponibles en la plataforma y, en entornos empresariales, convierten esas prácticas en estándares internos. Escalar desde una base de cinco millones de desarrolladores hacia empresas Fortune 500 líderes —que el comunicado menciona ya entre sus clientes— requiere precisamente el tipo de capacidad de go-to-market enterprise que los nuevos ejecutivos como Schuller y Malhotra aportan.

En resumen, este anuncio representa mucho más que una ronda de financiación estándar. Es la cristalización de una tesis estratégica que Groq ha construido durante una década: que la inferencia es el problema de infraestructura más importante de la era de la IA, que las arquitecturas convencionales de GPU no están optimizadas para resolverlo, y que existe espacio para un operador especializado que combine chip propio, nube global y experiencia operativa de primer nivel. El acuerdo con NVIDIA valida tecnológicamente la apuesta; los 650 millones de dólares la financian; y el nuevo equipo directivo tiene el mandato de convertirla en negocio a escala. Para el ecosistema de IA agéntica, Groq es un proveedor de infraestructura que merece seguimiento estrecho.

Groq capta 650 millones de dólares para convertirse en la nube de inferencia IA líder del mundo

Referencias