La empresa china de inteligencia artificial DeepSeek ha emergido como un potencial rival de ChatGPT de OpenAI, atrayendo una atención significativa en Wall Street

 

Fundada en julio de 2023 por Liang Wenfeng, la empresa desarrolló un modelo de IA, bajo el modelo de código abierto,  con costos de desarrollo notablemente bajos de aproximadamente 6 millones de dólares, lo que contrasta marcadamente con las inversiones en IA proyectadas de 1 billón de dólares de las principales empresas estadounidenses.

Si bien algunos analistas consideran que el costo anunciado del modelo puede estar disminuido a propósito por la empresa china para lograr un mayor impacto en el mercado, esos mismos analistas piensan que el costo real aún es significativamente menor al de las empresas de IA consolidadas, como Open AI. Sin embargo, es claro para todos que este anuncio pone presión en todas las empresas del área y que probablemente esto termine cambiando el funcionamiento de los modelos de Inteligencia Artificial, buscando una mayor eficiencia.

 

¿Un frenazo para el valor de NVidia?

El lanzamiento de la empresa china desencadenó una importante disrupción en el mercado, causando importantes caídas en el precio de las acciones de gigantes tecnológicos como Nvidia (caída del 17 %, perdiendo 600 mil millones de dólares en valor el lunes 27 de enero) y empresas de semiconductores como ASML y Broadcom. El índice Nasdaq, con un gran peso tecnológico, cayó un 3 %, mientras que las acciones relacionadas con la energía también experimentaron importantes caídas debido a las preocupaciones sobre la reducción de los requisitos energéticos para las tecnologías de IA.

 

Innovación tecnológica y enfoque único

DeepSeek se distingue por ser un LLM de código abierto que utiliza «computación en tiempo de inferencia», que activa solo las partes más relevantes del modelo para cada consulta, lo que resulta en eficiencia computacional y de costos. Los inversores tecnológicos como Marc Andreessen elogiaron la tecnología, calificándola de «uno de los avances más asombrosos e impresionantes», mientras que el modelo está actualmente disponible en la App Store de Apple y su sitio web.

 

¿Pero qué pasa con la privacidad y los sesgos?

La compañía ha planteado preocupaciones sobre la privacidad debido a sus prácticas de recopilación de datos, almacenando información de los usuarios en servidores en China, lo que genera comparaciones con controversias anteriores en torno a TikTok. A pesar de la tecnología innovadora, algunos analistas como Dan Ives siguen siendo escépticos sobre la adopción por parte de corporaciones estadounidenses de una startup china para infraestructura crítica de IA, destacando las posibles implicaciones geopolíticas y de seguridad.

Además, ya circulan en la Internet posts de usuarios que han sometido el modelo a preguntas “comprometedoras” como las libertades personales en China o si Taiwán es un país o parte de china. Las respuestas dejan claro que el modelo ha sido alimentado con un sesgo político claro, coincidente con la visión del Partido Comunista Chino, algo que podría comprometer seriamente algunas desiciones que se puedan tomar basados en información provista por Deepseek.

 

Perspectivas de la industria y perspectivas futuras

Si bien algunos analistas de Wall Street ven la liquidación de acciones del lunes como una reacción exagerada, la aparición de DeepSeek ha provocado debates más amplios sobre los costos de desarrollo de la IA, la competencia tecnológica y las demandas de infraestructura. La propia Nvidia reconoció los avances de DeepSeek y destacó que los recursos de GPU y de red siguen siendo cruciales para la inferencia de IA. El incidente pone de relieve el panorama global de la IA, que evoluciona rápidamente y es cada vez más competitivo.

Por el momento, el hardware usado por Deepseek parece provenir de Nvidia, pero en versiones no contempladas en las restricciones de exportación de hardware de IA a China, impuestas por el gobierno norteamericano.