Tabla de Contenidos
ToggleLa evolución de la inteligencia artificial en China
Imagina que necesitas extraer información de una factura escaneada, analizar un video de varias horas o incluso contar objetos en una imagen sin esfuerzo. Ahora, esto es posible gracias a Qwen2.5-VL, la nueva familia de modelos de inteligencia artificial lanzada por Alibaba. Mientras el mundo tecnológico se enfoca en los avances de DeepSeek, Alibaba demuestra que no se queda atrás en la competencia por la supremacía en IA.
¿Qué es Qwen2.5-VL y qué lo hace diferente?
La nueva serie de modelos Qwen2.5-VL tiene la capacidad de realizar tareas avanzadas de análisis de texto e imágenes, incluyendo:
- Comprender videos de varias horas.
- Analizar documentos, gráficos y cuadros.
- Extraer información de facturas y formularios escaneados.
- Contar objetos en imágenes y reconocer propiedades intelectuales de películas y series.
- Interactuar con software en PC y dispositivos móviles.
Según pruebas internas de Alibaba, su modelo más potente supera a GPT-4o de OpenAI, Claude 3.5 Sonnet de Anthropic y Gemini 2.0 Flash de Google en diversas evaluaciones, incluyendo comprensión de videos, análisis de documentos y respuesta a preguntas.
Un modelo con limitaciones regulatorias
Dado que Qwen2.5-VL es un desarrollo chino, tiene restricciones en ciertos temas. Su uso en la plataforma Qwen Chat está supervisado por reguladores de internet en China, asegurando que las respuestas sigan los valores socialistas fundamentales. Como resultado, temas delicados como la autonomía de Taiwán o críticas a figuras gubernamentales están bloqueados dentro del sistema.
Interacción con software y dispositivos

Una de las características más destacadas de Qwen2.5-VL es su capacidad para controlar aplicaciones y dispositivos, tanto en PC como en móviles. Un video de prueba mostró al modelo abriendo Booking.com y reservando un vuelo entre dos ciudades chinas. Sin embargo, su rendimiento en tareas complejas dentro de un entorno de escritorio parece aún limitado.
Disponibilidad y licencias
Alibaba ha lanzado diferentes versiones de Qwen2.5-VL, con distintas capacidades y licencias:
- Qwen2.5-VL-3B y Qwen2.5-VL-7B están disponibles con una licencia permisiva.
- Qwen2.5-VL-72B, el modelo más avanzado, requiere autorización de Alibaba para su uso comercial si la empresa interesada tiene más de 100 millones de usuarios activos mensuales.
Conclusión
Alibaba está demostrando su compromiso con la innovación en inteligencia artificial, ofreciendo modelos avanzados capaces de competir con los gigantes tecnológicos occidentales. Qwen2.5-VL representa un paso significativo en el desarrollo de IA en China, con aplicaciones en diversos campos, desde la automatización documental hasta la interacción con software. A medida que esta tecnología evoluciona, será interesante ver cómo se adapta a las necesidades globales y si podrá desafiar el dominio de OpenAI y Google en este ámbito.