DeepSeek R1 generó un gran impacto en la industria de la inteligencia artificial a principios de año, pero desde entonces ha habido poca evolución en el sector. La startup china anunció la semana pasada el lanzamiento de DeepSeek V3.1, una versión mejorada que combina características de DeepSeek V3 y R1, con un rendimiento superior según los benchmarks publicados.
Mejoras visibles (pero no dramáticas)
En la “tarjeta del modelo” disponible en Hugging Face, DeepSeek V3.1 mostró un ligero mejoramiento en áreas como programación y pruebas matemáticas comparado con su predecesor R1-0528. Sin embargo, algunos usuarios han señalado que el modelo no cumple con las expectativas en otras áreas, como el seguimiento de instrucciones, y tiene limitaciones en su soporte multimodal.
Un modelo chino para chips chinos
DeepSeek V3.1 ha sido diseñado para evitar la dependencia de chips extranjeros, utilizando precisión FP8 que optimiza su rendimiento en chips de IA de próxima generación fabricados en China. Esta estrategia se alinea con las prioridades del gobierno chino de fomentar el uso de modelos locales.
¿Y R1, qué?
La eliminación de referencias a DeepSeek R1 ha generado dudas sobre la posible llegada de un sucesor, DeepSeek R2. Mientras tanto, la empresa enfrenta una disminución en su cuota de mercado, que pasó del 99% en el primer trimestre al 80% en el segundo, debido a la creciente competencia local.
Competencia feroz
Modelos como Qwen de Alibaba y Kimi-K2-Instruct de MoonShoot AI están ganando popularidad, lo que ha contribuido a la pérdida de relevancia de DeepSeek. La startup también enfrenta retrasos en el desarrollo de DeepSeek R2, ya que ha tenido dificultades para entrenarlo con chips de Huawei.
Pero esta actitud es “muy china”
A diferencia de Occidente, donde se espera un ritmo rápido de innovación, en China se adopta una filosofía de estrategia a largo plazo. Las empresas suelen mantener un perfil bajo hasta que logran avances significativos, lo que sugiere que DeepSeek podría estar trabajando en nuevos desarrollos para continuar siendo un actor relevante en el campo de la inteligencia artificial.
Fuente original: ver aquí