Convulsión en la IA

Cuando todavía retumbaba el anuncio del compromiso de inversión por la friolera de US$ 500 millardos para el Proyecto Stargate (que se centrará en la construcción de centros de datos de alto rendimiento y sistemas informáticos avanzados que puedan soportar desarrollos actuales y futuros en IA), el fenómeno DeepSeek impactó fuertemente en el mundillo de la inteligencia artificial. Su presentación como un modelo de IA generativa a la altura de OpenAI y otras pero, y acá está lo realmente relevante, operando a una fracción muy menor (llamativamente menor) de su costo generó un estampida bursátil e hizo quedar a sus competidores como unos glotones insaciables de recursos. Sin embargo, con el paso de los días, la cosa se fue moderando y relativizando. No obstante, el shock ya se había logrado. Así, más allá del impacto propio de la llegada de DeepSeek como nuevo competidor en el mundo de la IA generativa, su meteórica irrupción deja aprendizajes que (deberían) ser útiles en adelante.

Muchos periodistas, analistas (financieros y tecnológicos) e influencers rápidamente aceptaron a pie juntillas información proveniente de DeepSeek, olvidando aquello de “cuando la limosna es grande, hasta el santo desconfía”. Esto no significa que las mejoras en la eficiencia en cuanto a la operación de su IA no sean reales. Pero no por ello hay que dejar de lado el modelo cartesiano de la duda como método.

Con el correr de los días, fueron saliendo a la luz diversos aspectos que invitaban a una aproximación más cautelosa. Quienes siguen de cerca y en profundidad el negocio de la IA generativa no se vieron tan sorprendidos por los costos de entrenamiento de la plataforma ya que, afirman, estos descienden aceleradamente. De esta forma, una comparación con los costos de tiempo atrás no puede hacerse linealmente. También el súbito auge de DeepSeek suscitó dudas y cuestionamientos sobre el origen de los datos de entrenamiento. De hecho, OpenAI acusó a DeepSeek de utilizar su modelo ChatGPT para entrenar a su chatbot (lo que dio lugar a la ironía de los memes).

Otro punto no menor es el alineamiento con las narrativas del gobierno chino condimentadas con censura. Para esto, basta con recurrir a la clásica indagación sobre lo ocurrido en la Plaza de Tiananmén en 1989 y obtener como respuesta un “hablemos de otro tema”. Algo que se repite con otros temas “sensibles” para el poder político chino.

También preocupa en el actual escenario de rivalidades geopolíticas el almacenamiento en servidores chinos (por más lógico que suene desde el punto de vista funcional) con las preocupaciones en materia de privacidad. Esto llevó a que países como Australia y Taiwán hayan bloqueado su uso en los ámbitos gubernamentales, mientras que Corea del Sur restringió el bloqueo a los ministerios de Defensa y de Comercio. Italia fue un paso más allá y bloqueó sus operaciones en el país tras la negativa de DeepSeek a someterse a las leyes de privacidad europeas. Por supuesto, otros (incluyendo a los EEUU y algunos europeos) están analizando la situación. Esto lleva a pensar que no sería llamativo que se prohíba el uso del chatbot en los organismos relacionadas con el gobierno o la seguridad nacional en diversos países. Por lo tanto, la pregunta que queda flotando entonces es por qué DeepSeek ha puesto a disposición de cualquiera que lo desee (incluyendo a los adversarios de China) una de sus piezas más avanzadas de tecnología de IA de forma gratuita y sin trabas. En definitiva, DeepSeek pone en evidencia como nunca la guerra fría entre China y varios países occidentales.

Si bien los menores costos de entrenamiento de DeepSeek no fueron desestimados aunque sí relativizados, no parecen haber dudas de que el modelo chino es más eficiente en su diseño (según testeos independientes), lo que le permite operar con hardware menos potente que el utilizado por sus rivales occidentales (más precisamente, los estadounidenses). Esto pone de manifiesto que las restricciones impuestas por EEUU a China en cuanto al acceso a su tecnología tuvieron un efecto no deseado aunque previsible: compensarlas agudizando el ingenio, permitiendo la innovación en un marco de limitaciones. Y también refuerza la adaptabilidad de las empresas chinas, como ya lo demostró Huawei.

Así, y más allá de las consideraciones políticas, hay algo en lo que la irrupción de DeepSeek tendrá un impacto claramente positivo: una manera más eficiente de proveer IA. Esto beneficiará no sólo a las empresas que lo hagan sino también a quienes la usen, sean organizaciones o individuos. Aunque esto aterre a quienes ven a la IA como una gran amenaza.

Acerca del autor

Enrique Carrier

Analista del mercado de telecomunicaciones y nuevos medios, basado en Buenos Aires, Argentina

Por Enrique Carrier

Your sidebar area is currently empty. Hurry up and add some widgets.