El futuro de la AGI y el análisis de empresas prometedoras: Desde chips NVIDIA hasta xAI Grok-3

El futuro de la AGI y el análisis de empresas prometedoras: Desde chips NVIDIA hasta xAI Grok-3

Perspectivas para la AGI y análisis de empresas clave

La AGI (Inteligencia Artificial General, inteligencia artificial general) se refiere a aquel tipo de inteligencia capaz de realizar todas las tareas intelectuales al mismo nivel o superior al de un ser humano. Recientemente, el interés por la AGI ha aumentado notablemente con la aparición de herramientas como ChatGPT, y varias empresas globales han comenzado a competir para alcanzar la AGI. Este informe de análisis examina las perspectivas futuras de la AGI, presenta las empresas más importantes que lideran el desarrollo, discute los actores más prometedores desde una perspectiva de inversión a largo plazo, y revisa los enormes recursos computacionales (GPU) necesarios para implementar la AGI.

Empresas líderes en el desarrollo de la AGI

Se considera que las siguientes empresas ya están a la vanguardia o se espera que tengan un gran impacto en la carrera por la AGI:

OpenAI
En el centro de la popularización del término AGI se encuentra OpenAI. Su misión se define como el desarrollo de AGI para el beneficio de toda la humanidad. Con el éxito en el lanzamiento de modelos de lenguaje a gran escala como GPT-3 y GPT-4, han dado un paso importante hacia la consecución de la AGI. Con el apoyo de Microsoft, han construido una supercomputadora especializada en IA, utilizando más de 10.000 GPU NVIDIA A100 para entrenar GPT-4; y para el siguiente modelo, GPT-5, se planea una ampliación a aproximadamente 25.000 GPU. OpenAI basa su objetivo de lograr una AGI segura y controlable en estos enormes recursos computacionales.

Google DeepMind
DeepMind, conocido por su IA que juega al Go, AlphaGo, es ahora parte de Google y opera bajo el nombre de Google DeepMind. El CEO Demis Hassabis ha presentado una hoja de ruta para alcanzar la AGI en los próximos 10 años, enfatizando la importancia de progresos graduales en lugar de un optimismo desmedido. Se ha puesto especial atención en la IA multimodal, es decir, modelos que no solo comprenden texto, sino también imágenes, sonido y vídeo, mediante el desarrollo del próximo modelo “Gemini”. Google DeepMind también ha lanzado Bard, un competidor de los modelos de OpenAI, y con unas pocas innovaciones adicionales, podrían alcanzar un nivel de inteligencia humana. Google invierte agresivamente en su infraestructura con sus propias TPU y grandes volúmenes de GPU NVIDIA, además de realizar inversiones estratégicas en competidores como Anthropic.

xAI
La nueva empresa xAI, fundada por Elon Musk (CEO de Tesla y SpaceX) en 2023, emerge como el “caballo negro” en la carrera por la AGI. Musk, excofundador de OpenAI, ha optado por seguir un camino propio. xAI presentó recientemente el chatbot “Grok”, vinculado a X (anteriormente Twitter), que ha llamado la atención por sus respuestas rápidas, oportunas y un estilo humorístico. Musk promociona ahora el último modelo de la empresa, Grok-3, afirmando que supera a los modelos más avanzados de la competencia. Indica que se utilizarán más de 100.000 GPU NVIDIA H100 para entrenar Grok-3, lo que equivale a cinco veces las usadas para Grok-2. Con un costo de entre 30.000 y 40.000 dólares por cada H100, la inversión es enorme, lo que sugiere que Grok-3, planeado para ser lanzado a finales de año, podría ser algo verdaderamente especial. xAI ya está probando internamente Grok-1.5 y planea el lanzamiento de Grok-2 en agosto de 2024, seguido de Grok-3 más tarde ese mismo año. Con las agresivas inversiones de Musk y su rápido ciclo de desarrollo, no es improbable que xAI pronto se haga notar en la carrera por la AGI.

Anthropic
Anthropic, una startup de IA fundada por exempleados de OpenAI, se centra en la seguridad de la IA y desarrolla la próxima generación de modelos de lenguaje a gran escala. La empresa ha lanzado la serie Claude, competidora de ChatGPT, y ha atraído importantes inversiones de Google. Su objetivo es desarrollar un nuevo modelo, denominado “Claude-Next”, que se espera sea diez veces más potente que GPT-4. Para lograrlo, Anthropic planea invertir más de 5.000 millones de dólares (aproximadamente 6 billones de KRW) en los próximos 2 a 4 años para entrenar un modelo de enormes dimensiones. A pesar de las altas ambiciones y de que el modelo pueda ser visto como un “cambio de juego divino”, la empresa ya ha comenzado a utilizar sus modelos de forma comercial y aspira a ser un actor líder en la era AGI, equilibrando seguridad y rendimiento.

Microsoft
Microsoft juega un papel crucial, no solo como desarrollador sino sobre todo como colaborador y usuario. Tras invertir 1.000 millones de dólares en OpenAI en 2019, se han comprometido a invertir hasta 10.000 millones de dólares en los próximos años en estrecha colaboración con OpenAI. Como socio de hardware, Microsoft Azure proporciona la infraestructura cloud necesaria para el desarrollo de la IA. Microsoft ya cuenta con una supercomputadora con más de 10.000 GPU para entrenar GPT-4 y planea preparar un clúster con más de 25.000 GPU para modelos futuros, considerando también el desarrollo de sus propios chips de IA. Además, Microsoft integra rápidamente la IA en sus productos – desde Bing y Office 365 hasta Windows – lo que les convierte en un actor central en el despliegue de la AGI.

Meta (Facebook)
Meta es otro gran actor, conocido principalmente por sus masivas inversiones en infraestructura de IA. Aunque Meta no tiene oficialmente la AGI como objetivo, su compromiso con la investigación y la infraestructura de IA es innegable. Con la publicación de grandes modelos de lenguaje como LLaMA, Meta ha generado una gran repercusión tanto en el ámbito académico como industrial, y también está invirtiendo en IA generativa para imágenes (por ejemplo, Imagen) y en IA multimodal. Meta planea asegurar más de 350.000 GPU NVIDIA H100 y un total de 600.000 chips de IA para 2024, lo que podría convertirse en la mayor potencia de cálculo de IA jamás vista. Estas inversiones hacen de Meta un fuerte competidor, especialmente si logran integrar modelos similares a la AGI en sus plataformas de redes sociales y en el metaverso.

(Se mencionan también otros actores como Baidu y Alibaba, pero este informe se centra principalmente en ejemplos de Estados Unidos.)

Oportunidades de inversión prometedoras en la era AGI (perspectiva a largo plazo)

El desarrollo de la AGI no solo afecta a instituciones de investigación y empresas de software, sino que tiene un impacto profundo en toda la industria, incluyendo hardware, semiconductores y servicios cloud. Desde una perspectiva de inversión a largo plazo, las siguientes empresas se mencionan a menudo como potenciales ganadoras en la era AGI:

  • Nvidia:
    Empresa líder en diseño de GPUs y el mayor beneficiario del auge de ChatGPT. Casi todas las empresas, incluyendo OpenAI, Google y Meta, dependen de las GPU Nvidia A100/H100 para entrenar sus modelos avanzados. A pesar de los altos precios (30.000–40.000 dólares por H100), la demanda se ha disparado, lo que ha llevado a ingresos récord en chips de IA para centros de datos.
  • AMD:
    Como principal competidor de Nvidia en el mercado de GPUs, AMD está creciendo gracias al desarrollo de su serie MI300 y aceleradores de IA. Con planes para comprar en masa las GPU Instinct de AMD de Google, el mercado está convencido de que un suministro confiable de GPUs – independientemente de la marca – es crucial.
  • TSMC:
    La mayor fundición del mundo fabrica chips de IA avanzados como NVIDIA H100, AMD MI300 y las TPU de Google. El aumento en la demanda de chips de IA impulsa la utilización de capacidad y los ingresos de TSMC, lo que la convierte en un actor central en la tecnología de semiconductores para IA.
  • Microsoft:
    Como socio cercano de OpenAI y con su propia plataforma cloud Azure, Microsoft probablemente se beneficiará enormemente de la transición global hacia la IA. Su rápida integración de la IA en productos como Bing, Office y Windows les otorga una ventaja estratégica.
  • Google:
    Google posee un ecosistema masivo que abarca servicios de búsqueda, cloud y plataformas móviles. A través de Google DeepMind y otras iniciativas, invierten en el desarrollo de tecnologías propias de AGI, lo que podría redefinir los modelos de ingresos en la búsqueda y la publicidad.
  • Meta:
    Con agresivas inversiones en investigación y en infraestructura de IA, Meta se posiciona como un potencial ganador en la futura era de la IA, aunque su objetivo en AGI no esté tan claramente definido.

Potencia de cálculo para la AGI (análisis de la escala de GPUs)

Para desarrollar AGI se requiere una enorme potencia de cálculo. Por ejemplo, para entrenar GPT-4 se utilizaron aproximadamente 20.000 GPUs NVIDIA durante 90–100 días, lo que resultó en alrededor de 2,15×10^25 operaciones y un rendimiento cercano a la capacidad lingüística humana. Se espera que modelos futuros, como Grok, requieran cantidades aún mayores de recursos computacionales:

  • OpenAI GPT-3: Se estima que se usaron miles de GPUs NVIDIA V100 (aproximadamente 36,4 millones de horas GPU).
  • OpenAI GPT-4: Utilizó decenas de miles de GPUs NVIDIA A100.
  • xAI Grok-2: Está previsto que se utilicen alrededor de 20.000 GPUs NVIDIA H100 (con finalización prevista para mayo de 2024).
  • xAI Grok-3: Se planea utilizar más de 100.000 GPUs NVIDIA H100 (objetivo: finales de 2024).
  • Meta AI Research SuperCluster: Planea asegurar hasta 350.000 GPUs NVIDIA H100.
  • Anthropic Claude-Next: Se estima que se requerirán cientos de miles de GPUs para lograr un rendimiento 10 veces superior al de GPT-4.
  • Google DeepMind Gemini: Utiliza una combinación de TPUs propias (en miles) y GPUs NVIDIA adicionales (las cifras exactas son confidenciales).

Estos datos muestran que el entrenamiento de modelos avanzados de IA requiere recursos computacionales a gran escala – desde decenas de miles hasta potencialmente más de un millón de GPUs en el futuro. Esto no solo demanda enormes inversiones en hardware, sino también una infraestructura considerable en términos de suministro eléctrico, espacio en centros de datos y estabilidad de la red. En última instancia, la carrera por asegurar esta potencia de cálculo es central para alcanzar la AGI, razón por la cual las principales empresas expanden agresivamente sus parques de supercomputadoras y reservas de GPUs.

Fuentes:

  1. OpenAI, “Planning for AGI and beyond” (2023)
  2. Nextplatform, “Microsoft is said to have used 10,000 Nvidia A100 GPUs to train GPT-4…” (2023)
  3. Geeky Gadgets, “Demis Hassabis… achieving AGI within the next decade” (2023)
  4. Reddit (resumen de TechCrunch), “Anthropic’s plan… raise $5B… build ‘Claude-Next’ 10 times more capable than GPT-4.” (2023)
  5. Business Insider, “Elon Musk: Grok 3 will train on 100,000 Nvidia H100 GPUs” (2024)
  6. TweakTown, “Grok 2 used ~20,000 H100 GPUs, Grok 3 will require 100,000 H100 GPUs” (2024)
  7. SemiAnalysis, “OpenAI’s GPT-4 used ~20k A100s for 90-100 days (2.15e25 FLOPs)” (2024)
  8. AI Tech Report, “Microsoft & OpenAI Project Stargate – $100B AI Supercomputer by 2028” (2024)

**#AGI

InteligenciaArtificial

InteligenciaGeneral

InversiónAI

NVIDIA

OpenAI

xAI

Grok3

TecnologíaDelFuturo

NvidiaChip**

Scroll al inicio