SemiAnalysis: los laboratorios de frontera no encuentran rentabilidad — ChatGPT Pro consume ~14.000 $ en cómputo al mes por solo 200 $/mes
⚠️ CONTENIDO DETRÁS DE MURO DE PAGO: El artículo completo de SemiAnalysis requiere suscripción de pago. El scraper solo ha podido descargar la interfaz de navegación, los menús de productos, los avisos de cookies y los banners de captación de suscriptores del sitio web — ningún párrafo del cuerpo del artículo está…
⚠️ CONTENIDO DETRÁS DE MURO DE PAGO: El artículo completo de SemiAnalysis requiere suscripción de pago. El scraper solo ha podido descargar la interfaz de navegación, los menús de productos, los avisos de cookies y los banners de captación de suscriptores del sitio web — ningún párrafo del cuerpo del artículo está disponible. Por tanto, el resumen que sigue se basa exclusivamente en el título tal como aparecía en el boletín reenviado a Manuel y en hechos ampliamente documentados públicamente, sin añadir ninguna cifra ni afirmación inventada.
El título del digest anticipa la tesis central del análisis: los laboratorios de inteligencia artificial de primera línea —llamados 'frontier labs'— son incapaces por el momento de encontrar un modelo de negocio rentable, incluso cuando cobran precios de suscripción premium. El ejemplo concreto que SemiAnalysis habría abordado es ChatGPT Pro: el plan de 200 dólares al mes que OpenAI lanzó a finales de 2024 estaría costando a la compañía en cómputo por usuario mucho más de lo que ingresa, según lo que sugiere el artículo (no se dispone de la cifra exacta).
Esta brecha entre precio de venta y coste real no es sorprendente en términos cualitativos. Desde que OpenAI lanzó ChatGPT Pro, múltiples analistas del sector señalaron que el plan estaba pensado para usuarios de altísima intensidad de uso — investigadores, programadores y profesionales que explotan las capacidades de modelos grandes como o1 y o1 Pro durante largas sesiones de razonamiento encadenado. Precisamente los modelos de razonamiento ('thinking models') son notoriamente más caros de servir porque generan grandes cantidades de tokens internos antes de producir una respuesta visible, lo que multiplica el coste de inferencia respecto a modelos convencionales.
SemiAnalysis es una de las publicaciones de referencia en el análisis económico de la infraestructura de semiconductores e inteligencia artificial. Su metodología habitual consiste en construir modelos de coste bottom-up: estiman el número de GPUs necesarias para servir un determinado nivel de tráfico, aplican costes reales de hardware (típicamente clusters de H100 o H200 de NVIDIA), añaden costes de energía, refrigeración, red y personal, y obtienen un coste total de propiedad (TCO) por token generado. Si el coste de servir a estos usuarios supera ampliamente el precio de suscripción de 200 dólares, representaría una pérdida operativa estructural de magnitud considerable.
Es importante contextualizar esta situación con cautela, dado que no hemos podido leer el artículo. La diferencia de coste probablemente corresponde a un perfil de usuario de uso máximo o extremo, no al usuario medio de ChatGPT Pro. Los análisis de TCO en inferencia de IA son muy sensibles a supuestos sobre la tasa de utilización de los clusters, el mix de modelos usados, el volumen de tokens de entrada y salida, y si se computan o no los costes de entrenamiento amortizados. Un usuario que usa ChatGPT Pro ocasionalmente para tareas sencillas probablemente cuesta mucho menos que un usuario intensivo.
El problema de fondo que el artículo parece abordar es estructural para todo el sector: la competencia entre OpenAI, Anthropic, Google DeepMind y Meta está llevando a los laboratorios a ofrecer capacidades cada vez más avanzadas a precios de consumidor, mientras los costes de entrenamiento e inferencia siguen siendo enormes. OpenAI ha reconocido públicamente que no es rentable. Anthropic también opera con pérdidas sustanciales. La estrategia implícita es crecer en usuarios y datos con la esperanza de que las eficiencias de escala, las mejoras en arquitecturas de modelos y la caída en el precio del silicio eventualmente cierren la brecha — pero ese punto de equilibrio sigue siendo incierto.
El papel de SemiAnalysis en este debate es relevante porque aporta rigor cuantitativo al análisis de costes de hardware, un área donde la mayoría de comentaristas carecen de la visibilidad necesaria para hacer estimaciones fiables. La publicación, dirigida por Dylan Patel, tiene acceso a datos de cadena de suministro de semiconductores, precios de contratos de GPU y arquitecturas de datacenter que le permiten construir modelos más precisos que los análisis de alto nivel habituales en medios generalistas.
Para los lectores del newsletter de IA Agéntica de Manuel, la implicación práctica más relevante es la siguiente: la economía actual de los modelos de frontera hace que los agentes de IA que consumen intensivamente capacidades de razonamiento avanzado sean extremadamente costosos de operar a escala. Cualquier producto o empresa que construya sobre APIs de modelos como o1, Claude 3.5 o Gemini Ultra debe tener muy presente que los precios actuales de API pueden no reflejar los costes reales de largo plazo, y que la dinámica de precios del sector está sujeta a revisiones significativas conforme los laboratorios busquen acercarse a la rentabilidad.
📌 RECOMENDACIÓN: Para acceder al análisis completo con los modelos de coste detallados, es necesario suscribirse a SemiAnalysis en newsletter.semianalysis.com. El precio de suscripción es significativamente inferior a lo que aparentemente cuesta servir a un usuario pro de ChatGPT.