Por revistaeyn.com
El lanzamiento de la startup china DeepSeek de sus últimos modelos de inteligencia artificial, que dice están a la par o mejor que los modelos líderes de la industria en Estados Unidos a una fracción del costo, amenaza con alterar el orden mundial de la tecnología.
La compañía ha atraído la atención en los círculos globales de IA después de escribir en un documento el mes pasado que el entrenamiento de DeepSeek-V3 requirió menos de US$6 millones de potencia de cálculo de los chips H800 de Nvidia.
El Asistente de IA de DeepSeek, impulsado por DeepSeek-V3, ha superado a su rival ChatGPT para convertirse en la aplicación gratuita mejor valorada disponible en la App Store de Apple en Estados Unidos.
Esto ha generado dudas sobre el razonamiento detrás de la decisión de algunas empresas tecnológicas estadounidenses de comprometer miles de millones de dólares en inversión en IA y las acciones de varios grandes actores tecnológicos, incluida Nvidia, se han visto afectadas, reporta Reuters.
A continuación, se presentan algunos datos sobre la empresa que está sacudiendo el sector de la IA en todo el mundo.
¿POR QUÉ DEEPSEEK ESTÁ CAUSANDO REVUELO?
El lanzamiento de ChatGPT de OpenAI a finales de 2022 provocó una lucha entre las empresas tecnológicas chinas, que se apresuraron a crear sus propios chatbots impulsados por inteligencia artificial.
Pero tras el lanzamiento del primer equivalente chino de ChatGPT, fabricado por el gigante de los motores de búsqueda Baidu, hubo una decepción generalizada en China por la brecha en las capacidades de IA entre las empresas estadounidenses y chinas.
La calidad y la rentabilidad de los modelos de DeepSeek han dado la vuelta a esta narrativa. Los dos modelos que han recibido una lluvia de elogios tanto por parte de los ejecutivos de Silicon Valley como de los ingenieros de las empresas tecnológicas estadounidenses, DeepSeek-V3 y DeepSeek-R1, están a la par con los modelos más avanzados de OpenAI y Meta, ha dicho la startup china.
También son más baratos de usar. El DeepSeek-R1, lanzado la semana pasada, es de 20 a 50 veces más barato de usar que el modelo OpenAI o1, dependiendo de la tarea, según una publicación en la cuenta oficial de WeChat de DeepSeek.
Pero algunos han expresado públicamente su escepticismo sobre la historia de éxito de DeepSeek.
El CEO de Scale AI, Alexandr Wang, dijo durante una entrevista con CNBC, sin proporcionar pruebas, que DeepSeek tiene 50.000 chips Nvidia H100, que afirmó que no se revelarían porque eso violaría los controles de exportación de Washington que prohíben que estos chips de IA avanzados se vendan a empresas chinas. DeepSeek no respondió de inmediato a una solicitud de comentarios sobre la acusación.
Los analistas de Bernstein destacaron en una nota de investigación que los costos totales de capacitación de DeepSeek para su modelo V3 eran desconocidos, pero eran mucho más altos que los US$5,58 millones que la startup dijo que se utilizaron para la potencia de cómputo. Los analistas también dijeron que los costos de entrenamiento del igualmente aclamado modelo R1 no fueron revelados.
¿QUIÉN ESTÁ DETRÁS DE DEEPSEEK?
DeepSeek es una startup con sede en Hangzhou cuyo accionista mayoritario es Liang Wenfeng, cofundador del fondo de cobertura cuantitativo High-Flyer, basado en registros corporativos chinos.
El fondo de Liang anunció en marzo de 2023 en su cuenta oficial de WeChat que estaba “empezando de nuevo”, yendo más allá del comercio para concentrar recursos en la creación de un “grupo de investigación nuevo e independiente, para explorar la esencia de AGI” (Inteligencia General Artificial). DeepSeek se creó más tarde ese año.
Los creadores de ChatGPT, OpenAI, definen los AGI como sistemas autónomos que superan a los humanos en las tareas más valiosas económicamente.
No está claro cuánto ha invertido High-Flyer en DeepSeek. High-Flyer tiene una oficina ubicada en el mismo edificio que DeepSeek, y también posee patentes relacionadas con grupos de chips utilizados para entrenar modelos de IA, según los registros corporativos chinos.
La unidad de IA de High-Flyer dijo en su cuenta oficial de WeChat en julio de 2022 que posee y opera un grupo de 10.000 chips A100.
¿CÓMO VE PEKÍN DEEPSEEK?
El éxito de DeepSeek ya se ha notado en los principales círculos políticos de China. El 20 de enero, el día en que DeepSeek-R1 se lanzó al público, el fundador Liang asistió a un simposio a puerta cerrada para empresarios y expertos organizado por el primer ministro chino, Li Qiang, según la agencia estatal de noticias Xinhua.
La presencia de Liang en la reunión es potencialmente una señal de que el éxito de DeepSeek podría ser importante para el objetivo político de Pekín de superar los controles de exportación de Washington y lograr la autosuficiencia en industrias estratégicas como la IA.