La startup china de inteligencia artificial DeepSeek ha lanzado este jueves la primera actualización de su popular modelo R1, reforzando así su posición de competencia con los gigantes tecnológicos estadounidenses.
La compañía china asegura que, con esta actualización, el rendimiento de R1 se acerca cada vez más a modelos líderes del mercado como 'o3' de OpenAI y Gemini 2.5 Pro de Google.
DeepSeek R1-0528 mejora de manera significativa la capacidad de razonamiento profundo e inferencia de R1, permitiendo al modelo manejar tareas complejas con mayor precisión, han explicado los desarrolladores.
MENOS ERRORES, MÁS CEATIVIDAD
Una de las principales mejoras del modelo, según DeepSeek, es que reduce las alucinaciones (respuestas falsas o erróneas) hasta en un 50% en tareas como reescribir y resumir textos.
La actualización permite además generar textos literarios como ensayos y novelas, así como otros tipos de contenidos creativos.
Asimismo, R1 ha mejorado sus habilidades en programación de código para crear interfaces para web o aplicaciones y en la creación de avatares para entornos virtuales.
"El modelo ha demostrado un rendimiento sobresaliente en evaluaciones de referencia en áreas como matemáticas, programación y lógica general", destacó DeepSeek.
LA POLÉMICA TÉCNICA DE 'DESTILACIÓN'
DeepSeek ha informado de que ha utilizado el proceso de razonamiento del modelo R1-0528 para mejorar el rendimiento del modelo Qwen 3 8B Base de Alibaba, mediante 'distillation' (destilación en castellano).
"Creemos que la cadena de razonamiento del modelo será crucial tanto para la investigación académica como para el desarrollo industrial de modelos de menor escala”, añadió la compañía.
La técnica de 'destilación' permite entrenar modelos de IA más pequeños, baratos y especializados aprendiendo de modelos más grandes.
De hecho, DeepSeek habría utilizado la tecnología de OpenAI para entrenar su R1, según publicaron en su momento medios estadounidenses.
UN LANZAMIENTO VIRAL
DeepSeek R1 salió a la luz el pasado mes de enero y se hizo viral de inmediato por sus buenos resultados, a pesar de contar con una inversión modesta y menor capacidad computacional que los modelos de las 'big tech'.
Su éxito puso en duda la necesidad de grandes inversiones y poder de cómputo para escalar modelos de IA.
En respuesta al crecimiento de DeepSeek, Google ha reducido precios para Gemini, mientras que OpenAI ha lanzado su versión o3 Mini, que consume menos recursos computacionales.
Otras compañías chinas como Alibaba y Tencent han lanzado sus propios modelos que, según afirman, superan al de DeepSeek.
Se espera que DeepSeek lance próximamente R2, el sucesor del modelo R1.