Alibaba lance Qwen 3.6 Max, son dernier modèle IA spécialement taillé pour l’agentique

Sommaire

Alibaba a dévoilé lundi Qwen 3.6-Max-Preview, le modèle le plus puissant jamais produit par son laboratoire d’intelligence artificielle. Six benchmarks de programmation tombés d’un coup, des scores en hausse sur le raisonnement avancé et la compréhension du monde, et une architecture taillée pour les agents autonomes. Le géant chinois du cloud ne se contente plus de jouer les outsiders.

Une artillerie de benchmarks pulvérisés

Qwen 3.6-Max-Preview s’est hissé en première position sur SWE-bench Pro (ingénierie logicielle en conditions réelles), Terminal-Bench 2.0 (exécution en ligne de commande), SkillsBench (résolution de problèmes généralistes), QwenClawBench (utilisation d’outils), QwenWebBench (interaction web) et SciCode (programmation scientifique). Les gains par rapport à son prédécesseur, Qwen 3.6-Plus, sont bien tangibles. SuperGPQA, qui mesure le raisonnement avancé, progresse de 2,3 %. QwenChineseBench, dédié à la performance en langue chinoise, bondit de 5,3 %. Le score en suivi d’instructions, évalué par ToolcallFormatIFBench, dépasse celui de Claude d’Anthropic.

Artificial Analysis, organisme indépendant de benchmarking, place d’ailleurs le modèle au deuxième rang mondial, juste derrière Muse Spark, et très largement au-dessus de la médiane des modèles de raisonnement comparables dans sa gamme de prix.

Architecture et accès développeur

Le modèle supporte une fenêtre de contexte de 256 000 tokens et traite exclusivement du texte, sans entrée d’image au lancement. Il est accessible via Qwen Studio et l’API Alibaba Cloud Model Studio (sous l’identifiant qwen3.6-max-preview), avec une compatibilité native pour les spécifications OpenAI et Anthropic. Les développeurs peuvent donc l’intégrer dans leurs pipelines existants sans réécriture lourde.

Une fonctionnalité baptisée preserve_thinking conserve les traces de raisonnement d’un tour de conversation à l’autre, ce qui se révèle particulièrement utile pour les tâches agentiques où la continuité du contexte conditionne la qualité de l’exécution. Pour quiconque fait tourner des agents autonomes ou des workflows de génération de code sur la durée, c’est un ajout qui pèse lourd.

Une gamme complète, du cloud au local

La famille Qwen 3.6 couvre désormais tout le spectre. Max-Preview trône au sommet pour les charges de travail les plus exigeantes. Qwen 3.6-Plus, doté d’une fenêtre de contexte d’un million de tokens et de capacités multimodales (raisonnement visuel, compréhension de documents, analyse du monde physique), occupe le segment intermédiaire. Flash vise les tâches où la vitesse prime. Et puis il y a Qwen 3.6-35B-A3B, open source, qui active seulement 3 milliards de paramètres sur ses 35 milliards à chaque inférence… Un choix d’architecture pensé pour réduire drastiquement les coûts de calcul tout en préservant la qualité des sorties, idéal pour le déploiement local.

« Nous pensons que l’avenir de l’IA multimodale ne réside pas uniquement dans la performance sur des tâches isolées, mais dans un soutien holistique aux opérations orientées workflow », a déclaré l’équipe Qwen dans un billet de blog.

Le virage propriétaire d’Alibaba

Qwen 3.6-Max-Preview est un modèle propriétaire, sans poids ouverts. Ce choix tranche avec la stratégie historique d’Alibaba, qui avait bâti l’essor fulgurant de Qwen sur l’accès gratuit et l’open source. Qwen avait d’ailleurs détrôné Llama de Meta comme modèle auto-hébergé le plus déployé au monde, en tout cas avant ce pivot vers la monétisation.

Le mouvement s’inscrit dans une tendance plus large parmi les laboratoires chinois. MiniMax a récemment réécrit sa licence open source pour bloquer l’usage commercial sans autorisation écrite. Alibaba a fermé le tier gratuit de Qwen Code quelques jours avant le lancement de Max-Preview. Les modèles ouverts chinois sont passés de 1,2 % de l’usage mondial fin 2024 à environ 30 % fin 2025, et cette adoption massive sert désormais de levier pour basculer vers des offres payantes.

Qui peut encore prétendre que la course à l’IA de frontière se joue uniquement entre la Californie et le Massachusetts ? Alibaba a explicitement étiqueté Max-Preview comme un travail en cours, avec des gains supplémentaires attendus dans les prochaines versions. Le modèle que le groupe positionne face à GPT-5.4 d’OpenAI et Claude Opus 4.7 d’Anthropic n’a donc même pas encore atteint sa forme définitive.

Alibaba lance Qwen 3.6 Max, son dernier modèle IA spécialement taillé pour l’agentique

Une artillerie de benchmarks pulvérisés

Architecture et accès développeur

Une gamme complète, du cloud au local

Le virage propriétaire d’Alibaba

Derniers articles

Foxconn lance son recrutement massif pour produire l’iPhone 18 Pro avant septembre

GTA 6 : le syndicat de Rockstar Games force la main du studio et réclame sa reconnaissance avant le lancement du jeu

France : les réseaux sociaux interdits aux moins de 15 ans, une loi historique entre ambition et vertige technique

Avis sur Zlancia : anatomie d’une arnaque au trading

Tendance

iOS 27 en bêta publique : Siri dopé à l’IA arrive enfin sur iPhone

iOS 27 bêta publique : date probable, iPhone compatibles et faut-il l’installer ?

GPT‑5.6 aurait “triché” pendant ses tests : faut-il encore croire aux benchmarks IA ?

GTA 6 : le gameplay se rapproche et Rockstar a déjà semé des indices partout

Windows 11 démembre Phone Link : la synchronisation Android s’installe au cœur du système

Vous allez aussi aimer

Claude Fable 5 vs GPT-5.6 Sol : le duel des deux LLM frontière décortiqué benchmark par benchmark

Le vrai goulot d’étranglement de l’IA en entreprise n’est pas le GPU, c’est la donnée

Amazon face à OpenAI et Anthropic : pourquoi AWS refuse de courir comme les laboratoires frontier

Maîtriser PixVerse AI : prompts, mouvements de caméra et astuces de pro

SpaceX rachète Cursor pour 60 milliards de dollars et fait du code assisté par IA une infrastructure stratégique

GPT-5.6 : Washington lève l’embargo, OpenAI lance ses modèles Sol, Terra et Luna jeudi

Claude Fable 5 et Mythos 5 c’est fini ! Anthropic débranche ses deux modèles sur ordre de Washington

Figure AI accélère la production de son robot humanoïde Figure 03 jusqu’à un robot par heure

Infos légales

Maj récentes

CyberGhost VPN casse son prix à 1,59 €/mois : 88 % de remise et 2 mois offerts

Apple M7 Ultra : jusqu’à 1,5 To de mémoire unifiée et une ambition « classe Nvidia Blackwell » pour 2028

iPhone : Apple grimpe à 20% du marché smartphone au Q2 2026, un record dans un secteur en chute

Pixel 11 dévoilé sur Amazon : couleurs, RAM, stockage et Tensor G6 avant l’heure

Qui sommes nous ?

Une artillerie de benchmarks pulvérisés

Architecture et accès développeur

A lire également

Une gamme complète, du cloud au local

Le virage propriétaire d’Alibaba

Derniers articles

Tendance

Vous allez aussi aimer