La startup china DeepSeek ha lastrado al mercado occidental de inteligencia artificial con el lanzamiento de su último modelo de IA.
Terremoto en Wall Street. Las grandes empresas tecnológicas especializadas en inteligencia artificial se están anotando una sesión completamente negra en la jornada de hoy, con Nvidia desplomándose más de un 10% en premercado y lastrando a otras empresas occidentales del sector, como ASML.
Detrás de esta dura jornada, se encuentra un único protagonista: DeepSeek, una startup china especializada en inteligencia artificial que ha sacudido todos los mercados con el lanzamiento de su último modelo, DeepSeek-R1, una herramienta capaz de superar a los últimos modelos de OpenAl con un coste mucho más reducido.
Pero ¿qué es exactamente DeepSeek y cuál puede ser su impacto en el mercado global de inteligencia artificial?
¿Qué es DeepSeek?
DeepSeek es una startup china de inteligencia artificial que está siendo la sensación de los mercados en el arranque de la semana. El lanzamiento de su innovador modelo de inteligencia artificial, DeepSeek-R1, que ofrece un rendimiento comparable al de los mejores chatbots del mundo con un coste muy inferior, está poniendo en tela de juicio la creencia generalizada de que el futuro de la inteligencia artificial requerirá cantidades cada vez mayores de inversión, de potencia y de energía para desarrollarse.
Creada en mayo de 2023 por el empresario Liang Wenfeg, DeepSeek ha sido financiada únicamente por el fondo de cobertura chino High-Flyer, también propiedad de Liang Wenfeng, y hasta la fecha ha presentado varios modelos de lenguaje con los que se ha ido abriendo hueco dentro del sector.
La compañía presentó su primer modelo de código abierto, DeepSeek Coder, en noviembre de 2023, al que le siguió DeepSeek LLM, creado para competir con otros modelos extensos de lenguaje. Tras ambos lanzamientos, DeepSeek presentó DeepSeek-V2, un modelo que vio la luz en mayo de 2024 y con el que consiguió cierta atención en China por dos motivos: su eficiencia y bajos costes, dos características que comparte con su última propuesta, DeepSeek-R1. Meses después, en junio, la empresa lanzó DeepSeek-Coder-V2, una versión mejorada de su anterior modelo capaz de soportar 338 lenguajes de programación y con una ventana de contexto de hasta 128.000 tokens.
Su irrupción a nivel internacional, no obstante, no llegaría hasta 2025, con el explosivo lanzamiento de sus dos últimos modelos: DeepSeek-V3, un modelo de lenguaje de gran tamaño (LLM) con 671 mil millones de parámetros y entrenado con tan solo 2,7 millones de horas que ofrece un rendimiento semejante al de los grandes actores occidentales del sector, y DeepSeek-R1, una herramienta especializada en razonamiento avanzado desarrollada sobre DeepSeek V-3 que ha superado a los modelos de OpenAI en varias pruebas de programación y matemáticas, agitando todos los mercados.
Principales características de DeepSeek R-1
DeepSeek-R1, el nuevo modelo lanzado por DeepSeek, constituye un modelo de lenguaje con un presupuesto limitado que puede aprender y mejorar automáticamente sin supervisión humana, mostrando unos resultados impresionantes con recursos limitados.
La empresa afirmó que ha utilizado solo 2.048 chips de Nvidia H800 y 5,5 millones de dólares para entrenar este nuevo modelo, un hecho impresionante si lo comparamos con las cantidades gastadas por otros gigantes como OpenAI o Google. Según los últimos análisis, se estima que la inversión en inteligencia artificial por parte de las grandes empresas tecnológicas estadounidenses alcanzó los 224.000 millones de dólares solo durante el año pasado, una cifra mucho mayor que la empleada por la startup china.
Más allá de sus bajos costes, DeepSeek-R1 se caracteriza por ser un modelo de código abierto, por lo que cualquier persona puede comprobar cómo funciona internamente y descargarlo para su uso particular con total libertad. Es decir: se trata de un modelo completamente transparente y accesible, lo que puede impulsar su adopción entre la población.
¿Cuáles son las diferencias con OpenAI?
El modelo RI de DeepSeek es de código abierto y se distribuye con una licencia MTI, lo que permite que cualquier investigador pueda acceder a él y distribuirlo, mientras que OpenAI, que originalmente comenzó como una empresa de código abierto con la misión de beneficiar a toda la humanidad, ha pasado recientemente a ser de código cerrado. Además, el coste de formación y desarrollo de los modelos de DeepSeek parece ser solo una fracción de lo que se requiere para los mejores productos de OpenAI o Meta Platforms.
En concreto, el primer LLM de código abierto de DeepSeek, DeepSeek-V3, lanzado en diciembre pasado, se construyó por menos de 6 millones de dólares, utilizando chips H800 de Nvidia (NASDAQ: NVDA) para el entrenamiento, una cifra muy inferior a la de OpenAI y otras empresas occidentales. A pesar de este bajo coste, la R1, construida a partir de la V3, se posiciona a la par con la O1 de OpenAI, llegando a superar a ChatGPT en algunas tareas complejas, como las pruebas relacionadas con problemas matemáticos o la evaluación de razonamiento avanzado.
Como contrapunto, al igual que todos los demás modelos de inteligencia artificial fabricados en China, DeepSeek censura temas considerados políticamente sensibles en China. A diferencia de ChatGPT, DeepSeek desvía las preguntas sobre la Plaza de Tiananmen, el presidente Xi Jinping o la posibilidad de que China invada Taiwán, lo cual puede resultar chocante para los usuarios internacionales.
Aun así, la aplicación móvil DeepSeek fue descargada 1,6 millones de veces hasta el 25 de enero y ocupó el puesto número 1 en las tiendas de aplicaciones de iPhone en Australia, Canadá, China, Singapur, Estados Unidos y el Reino Unido, según datos del rastreador de mercado App Figures. Las reseñas de los usuarios han elogiado su transparencia, al mostrar su trabajo y razonamiento a medida que responde las consultas y solicitudes.
¿Qué impacto tiene en el sector de la inteligencia artificial?
El éxito de DeepSeek puede impulsar a OpenAI y otros proveedores estadounidenses a reducir sus precios para mantener su liderazgo establecido. También pone en tela de juicio el enorme gasto de empresas como Meta y Microsoft (cada una de las cuales se ha comprometido a realizar gastos de capital de 65.000 millones de dólares o más este año, principalmente en infraestructura de IA) si los modelos más eficientes pueden competir con un desembolso mucho menor.
Su eficiencia pone en tela de juicio la necesidad de grandes gastos de capital para adquirir los aceleradores de IA más recientes y potentes de empresas como Nvidia. Además, plantea la posibilidad de que China supere a Estados Unidos en esta nueva y floreciente tecnológica, dando una vuelta de tuerca a la carrera de la inteligencia artificial que hemos visto en los últimos años.
Este hecho también aumenta la atención sobre las restricciones estadounidenses a la exportación de semiconductores tan avanzados a China, que tenían como objetivo evitar un avance del tipo que DeepSeek parece representar. Por el momento, las empresas occidentales del sector de la inteligencia artificial están firmando una jornada negra, con Nvidia cayendo más de un 13% y ASML, una de las grandes empresas del sector europeo, desplomándose. El índice tecnológico de referencia en Estados Unidos, el Nasdaq 100, está retrocediendo, mientras que el S&P 500 se anota leves caídas. Por el contrario, los índices de Asia están firmando una sesión optimista, con el índice Hang Seng, de Hong Kong, subiendo más de un 2%.
Posibles aranceles de Trump: ¿cómo pueden afectar a DeepSeek?
DeepSeek ha tenido que sortear las restricciones estadounidenses sobre semiconductores impuestas a China, que han impedido al país acceder a los chips más potentes del mundo, incluidos los H100 de Nvidia, a los que Washington prohibió su exportación. El éxito del laboratorio sugiere que DeepSeek ha encontrado una forma de sortear estas normas o que las sanciones de Washington no han sido tan eficaces como se pretendía.
La respuesta de Donald Trump no debería tardar, pero, ante los avances de DeepSeek, creemos que podrían acelerar su propuesta de un arancel del 60% sobre todos los bienes importados y otra serie de medidas, al país que siempre ha considerado como una amenaza para EEUU. Sin embargo, China ha demostrado que la estrategia de restringir el acceso a recursos críticos como los semiconductores avanzados ha tenido un efecto contrario, alentando a Pekín a redoblar sus esfuerzos.
Análisis realizado por los analistas de XTB
Deja una respuesta
Lo siento, debes estar conectado para publicar un comentario.