Una nueva startup china en la industria de inteligencia artificial (IA) es Redefinir el desarrollo del modelo de IA con una estrategia innovadora que desafía a los gigantes como OpenAi y Anthrope. Su reciente lanzamiento, Deepseek-v3, ha demostrado ser capaz de igualar e incluso superar las capacidades de los modelos tradicionales, pero con un costo significativamente menor.
Mientras entrena modelos de IA como GPT-4 requerimiento inversiones superiores a los 100 millones de dólares Y utilizando miles de GPU de alta gama, Deepseek ha logrado reducir drásticamente estos costos. Según la compañía, capacitaron su modelo insignia con solo 6 millones de dólares, usando chips Nvidia H800Diseñado como una alternativa limitada a las sanciones impuestas por los Estados Unidos en China.
Puedes leer: Plan nuclear de Milei
Jensen Huang, CEO de Nvidia, presentó la supercomputadora personal hace días
Uno de los aspectos clave de su tecnología es la optimización de los parámetros del modelo. Deepseek usa solo 37 mil millones de parámetros activos simultáneamente dentro de un sistema total de 671 mil millones. Esta estrategia permite que los modelos funcionen con menos uso de hardware, lo que abre la posibilidad de ejecutarlos en GPU convencionalescomo los videojuegos, reduciendo la dependencia de los costosos centros de datos.
Deepseek ha implementado un sistema múltiple que optimiza el procesamiento de la información, permitiendo Analizar oraciones completas en lugar de palabra por palabra. Aunque esto puede significar una menor precisión en algunos contextos, mejora significativamente la velocidad y la eficiencia operativa.
Otra innovación es la Reducción de la precisión numérica de los cálculos, pasando de 32 bits a 8 bits, Lo que nos ha permitido reducir drásticamente el uso de la memoria sin comprometer la calidad de los resultados. Además, la compañía ha optado por un modelo de “expertos” que se activan según sea necesarioMejorar la eficiencia y reducir el consumo de recursos.
Impacto global y reacción del mercado
El lanzamiento del modelo Deepseek R1 en enero de 2025 tuvo repercusiones inmediatas en los mercados de tecnología. Compañías como Nvidia y Oracle vieron caer sus acciones en un 10% y 8% respectivamente, mientras que SoftBank, un inversor clave en nuevas empresas de IA, informó una pérdida del 8%. El Nasdaq 100 cayó un 4%, su mayor caída desde 2022.
Figuras influyentes como Marc Andreessen han comparado el desarrollo de Deepseek con el “Momento Sputnik“, destacando el Avance tecnológico de China Como punto de inflexión en la carrera global por la inteligencia artificial.
El modelo Deepseek representa un desafío significativo para las grandes corporaciones de tecnología occidental, lo que les obliga a reconsiderar sus estrategias de inversión y eficiencia de costo. Empresas como Openai y Anthrope, que dependen de una gran infraestructura y grandes presupuestos, podrían encontrarse a sí mismos obligado a adoptar métodos más eficientes para seguir siendo competitivos.
El meme que muestra la revolución de Deepseek
Puede que le interese: “Me gustó la entrevista, voy a invertir 500 millones de dólares en Argentina”