Noticias
27/04/25, 17:00:15
Filtrado el DeepSeek R2: una bestia de IA que promete ser 97% más barata que GPT-4
https://static.htcmania.com/ChatGPT Image 27 abr 2025, 08_14_36-27042025-48704-htcmania.webp
La compañía china DeepSeek está generando gran expectación con los rumores sobre su próximo modelo de inteligencia artificial, el DeepSeek R2, que podría revolucionar el mercado de la IA por segunda vez. Tras el éxito del modelo R1, que demostró que el desarrollo de IA de alto nivel no requiere los costes millonarios habituales, DeepSeek planea ahora superar a competidores como OpenAI y Google con un modelo más potente y mucho más económico. Según las filtraciones, el DeepSeek R2 adoptará una arquitectura Mixture of Experts (MoE) híbrida avanzada, combinando mecanismos de enrutamiento mejorados y capas densas, lo que permitiría gestionar cargas de trabajo complejas de forma optimizada. El modelo contaría con 1,2 billones de parámetros, el doble que su antecesor, situándose a la altura de modelos como GPT-4 Turbo o Gemini 2.0 Pro. Sin embargo, lo más llamativo es su coste operativo: el R2 ofrecería precios por token hasta un 97,4% más bajos que los de GPT-4, con solo 0,07 dólares por millón de tokens de entrada y 0,27 dólares por millón de tokens de salida. Esto podría posicionarlo como la opción más rentable del mercado para empresas y desarrolladores. Además, el modelo estaría entrenado mayoritariamente con los chips Huawei Ascend 910B, aprovechando un clúster con potencia de 512 PetaFLOPS en precisión FP16 y alcanzando un 82% de utilización de esta infraestructura. Esta integración vertical permitiría a DeepSeek reducir aún más los costes y depender menos de proveedores externos. Aunque los datos aún no son oficiales y provienen de medios chinos, todo apunta a que el DeepSeek R2 podría ser un lanzamiento clave que impacte directamente en el ecosistema de la IA a nivel global.
fuente (https://wccftech.com/deepseek-r2-ai-model-rumors-begin-to-swirl-online/)
https://static.htcmania.com/ChatGPT Image 27 abr 2025, 08_14_36-27042025-48704-htcmania.webp
La compañía china DeepSeek está generando gran expectación con los rumores sobre su próximo modelo de inteligencia artificial, el DeepSeek R2, que podría revolucionar el mercado de la IA por segunda vez. Tras el éxito del modelo R1, que demostró que el desarrollo de IA de alto nivel no requiere los costes millonarios habituales, DeepSeek planea ahora superar a competidores como OpenAI y Google con un modelo más potente y mucho más económico. Según las filtraciones, el DeepSeek R2 adoptará una arquitectura Mixture of Experts (MoE) híbrida avanzada, combinando mecanismos de enrutamiento mejorados y capas densas, lo que permitiría gestionar cargas de trabajo complejas de forma optimizada. El modelo contaría con 1,2 billones de parámetros, el doble que su antecesor, situándose a la altura de modelos como GPT-4 Turbo o Gemini 2.0 Pro. Sin embargo, lo más llamativo es su coste operativo: el R2 ofrecería precios por token hasta un 97,4% más bajos que los de GPT-4, con solo 0,07 dólares por millón de tokens de entrada y 0,27 dólares por millón de tokens de salida. Esto podría posicionarlo como la opción más rentable del mercado para empresas y desarrolladores. Además, el modelo estaría entrenado mayoritariamente con los chips Huawei Ascend 910B, aprovechando un clúster con potencia de 512 PetaFLOPS en precisión FP16 y alcanzando un 82% de utilización de esta infraestructura. Esta integración vertical permitiría a DeepSeek reducir aún más los costes y depender menos de proveedores externos. Aunque los datos aún no son oficiales y provienen de medios chinos, todo apunta a que el DeepSeek R2 podría ser un lanzamiento clave que impacte directamente en el ecosistema de la IA a nivel global.
fuente (https://wccftech.com/deepseek-r2-ai-model-rumors-begin-to-swirl-online/)