
La empresa china de inteligencia artificial DeepSeek ha retrasado el lanzamiento de su nuevo modelo tras no lograr entrenarlo utilizando los chips de Huawei, lo que pone de manifiesto las limitaciones del impulso de Pekín por reemplazar la tecnología estadounidense.
DeepSeek recibió recomendaciones de las autoridades para adoptar el procesador Ascend de Huawei en lugar de utilizar sistemas de Nvidia, después de lanzar su modelo R1 en enero, según tres fuentes cercanas al asunto.
No obstante, la startup china enfrentó problemas técnicos persistentes durante el proceso de entrenamiento de su modelo R2 utilizando los chips Ascend, lo que la llevó a usar chips de Nvidia para el entrenamiento y los de Huawei para la inferencia, según las fuentes.
Estos problemas fueron la principal razón por la que el lanzamiento del modelo se retrasó desde mayo, lo que provocó que DeepSeek perdiera terreno frente a sus competidores, indicó una persona con conocimiento de la situación.
El entrenamiento implica que el modelo aprenda de un gran conjunto de datos, mientras que la inferencia se refiere al uso de un modelo entrenado para hacer predicciones o generar respuestas, como en el caso de una consulta de chatbot.
Las dificultades de DeepSeek muestran cómo los chips chinos aún están rezagados en comparación con sus rivales estadounidenses para tareas críticas, destacando los desafíos que enfrenta China en su intento de ser autosuficiente tecnológicamente.
El Financial Times reportó esta semana que Pekín ha exigido a las empresas tecnológicas chinas que justifiquen sus pedidos de los chips H20 de Nvidia, en un movimiento para alentarlas a promover alternativas fabricadas por Huawei y Cambricon.
Los expertos de la industria han señalado que los chips chinos sufren de problemas de estabilidad, conectividad interchip más lenta y software inferior en comparación con los productos de Nvidia.
Huawei envió un equipo de ingenieros a la oficina de DeepSeek para ayudar a la empresa a utilizar su chip de IA en el desarrollo del modelo R2, según dos fuentes. Sin embargo, a pesar de tener al equipo en el lugar, DeepSeek no pudo realizar un entrenamiento exitoso con el chip Ascend, afirmaron las fuentes.
DeepSeek continúa trabajando con Huawei para hacer que el modelo sea compatible con Ascend para la inferencia, indicaron las fuentes.
El fundador Liang Wenfeng ha expresado internamente su insatisfacción con el progreso del R2 y ha estado presionando para dedicar más tiempo a construir un modelo avanzado que pueda mantener la ventaja de la empresa en el campo de la IA, según informaron.
El lanzamiento del R2 también se retrasó debido a un etiquetado de datos más largo de lo esperado para su modelo actualizado, añadió otra persona. Informes de medios chinos han sugerido que el modelo podría ser lanzado en las próximas semanas.
“Los modelos son mercancías que pueden intercambiarse fácilmente”, dijo Ritwik Gupta, investigador de IA en la Universidad de California, Berkeley. “Muchos desarrolladores están utilizando Qwen3 de Alibaba, que es potente y flexible.”
Gupta señaló que Qwen3 adoptó los conceptos centrales de DeepSeek, como su algoritmo de entrenamiento que hace que el modelo sea capaz de razonar, pero los hizo más eficientes de usar.
Gupta, quien sigue el ecosistema de IA de Huawei, mencionó que la empresa está enfrentando “dolores de crecimiento” en el uso de Ascend para el entrenamiento, aunque espera que el campeón nacional chino se adapte eventualmente.
“Solo porque no estamos viendo modelos líderes entrenados en Huawei hoy no significa que no sucederá en el futuro. Es solo cuestión de tiempo”, afirmó.
Nvidia, un fabricante de chips en el centro de una batalla geopolítica entre Pekín y Washington, acordó recientemente dar al gobierno de EE. UU. una parte de sus ingresos en China para reanudar las ventas de sus chips H20 al país.
“Los desarrolladores jugarán un papel crucial en la construcción del ecosistema de IA ganador”, declaró Nvidia sobre las empresas chinas que utilizan sus chips. “Rendir mercados y desarrolladores solo perjudicaría la economía y la seguridad nacional estadounidense.”
DeepSeek y Huawei no respondieron a una solicitud de comentarios.
Fuente original: ver aquí
