A lo largo de los últimos meses, los modelos de inteligencia artificial han ido añadiendo funcionalidades que nos ayudan en tareas que parecían imposibles hace unos años.
Este último año, además de la generación de imágenes y video con una calidad impresionante, han proliferado funcionalidades como la asistencia a la hora de escribir código.
Modelos como GitHub Copilot (basado en Codex de OpenAI), CodeLlama de Meta, StarCoder2 de Hugging Face, Claude Opus 4 o DeepSeek-Coder han marcado un antes y un después al ofrecer a los desarrolladores ayuda en tiempo real, e incluso detectar errores con muchísima precisión.
Hasta ahora, podemos decir que, además de hacer otras tareas, los modelos sabían programar.
De nuevo, China ha dado un paso adelante y ha lanzado Qwen3-Coder, el nuevo modelo de Alibaba, que no solo compite con los modelos occidentales, sino que en muchos aspectos los supera.
La gran diferencia es que Qwen3-Coder es un modelo de lenguaje creado por Alibaba y pensado específicamente para trabajar con código. No es un modelo general que «también sabe programar», sino que ha sido entrenado desde el principio con ese objetivo: entender, escribir y mejorar código.
Lo interesante de Qwen3-Coder es que no solo completa líneas de código o responde dudas técnicas, sino que es capaz de abordar tareas de programación complejas, como escribir funciones completas, interpretar instrucciones, moverse con soltura entre varios lenguajes de programación y razonar de forma lógica sobre estructuras y algoritmos.
Y como todos los modelos de inteligencia artificial que vienen de China, tiene un plus: la optimización a la hora de entrenar el modelo que permite hacer más con menos recursos.
Este modelo no se ha construido como un bloque único y gigante, sino con lo que se llama Mixture of Experts (MoE) que ya utilizó DeepSeek. Es como una especie de «equipo de expertos» que trabajan juntos, cada uno especializado en algo distinto.
En el caso de Qwen3-Coder, en lugar de que el modelo completo se active cada vez que se le hace una pregunta, solo se activan los «expertos» más adecuados para esa tarea concreta. Es como si tuviéramos un equipo de 160 personas especialistas en distintas áreas del código y que, cuando haces la consulta, solo las 8 que más saben de eso se pusieran a trabajar. Así se consigue la mejor respuesta con pocos recursos y el modelo es más eficiente, barato y más rápido.
Qwen3-Coder además ha sido entrenado con muchísimos ejemplos de código real y datos creados artificialmente (pero de alta calidad), lo que le ha permitido aprender a programar bien desde ángulos muy distintos. En total, ha aprendido de más de 7 billones de fragmentos de información (tokens), y un 70 % de ellos eran código de verdad.
Pero no solo ha aprendido con ejemplos: también se le ha entrenado con técnicas avanzadas que le permiten razonar paso a paso, resolver tareas largas y complicadas, y adaptarse a cualquier reto según lo que se va encontrando. Esto se consiguió utilizando entornos de entrenamiento automáticos, donde el modelo tenía que resolver problemas ficticios como si estuviera en un entorno de trabajo real. Y lo hacía no solo una vez, sino en miles de pruebas al mismo tiempo, gracias a la potencia de los servidores de Alibaba.
Otra gran ventaja es la ventana de contexto (la cantidad máxima de información que el modelo puede «tener en mente» al mismo tiempo mientras responde, como si fuera su memoria a corto plazo).
Qwen3-Coder tiene una ventana de contexto nativa de 256.000 tokens (simplificando mucho podríamos decir que equivale a más de 150.000 palabras), y, en algunos entornos controlados, puede llegar a procesar hasta un millón. Esto significa que puede leer archivos muy largos, proyectos completos de software, manuales enteros, o grandes volúmenes de código sin perderse ni olvidar lo anterior.
En el caso de programación, como os podéis imaginar, esto supone una ventaja enorme. Puedes pedirle que revise toda la estructura de código, que entienda cómo interactúan distintos módulos, o que te diga dónde está el error en un archivo que ocupa decenas de páginas. Y él lo podrá ver y procesar todo a la vez, sin que tengas que dividirlo en partes, es decir, puede trabajar con proyectos grandes sin perder el hilo.
Aún hay más: Qwen3-Coder es open source, lo que permite usarlo, adaptarlo, afinarlo y desplegarlo con total libertad.
Si lo comparamos con otros modelos de código abierto, la eficiencia que ofrece (es decir, lo bien que rinde sin necesidad de las mejores GPUs) lo hace especialmente interesante para empresas o desarrolladores que quieren resultados rápidos y precisos sin depender de grandes infraestructuras.
Qwen3-Coder supone, por tanto, una nueva revolución, ya que no es solo «un modelo más que sabe programar» sino una herramienta diseñada para hacerlo bien, con buenos resultados, eficiente y open source. Casi nada.