Chez Google, on ne fait pas dans la demi-mesure. Après le lancement remarqué de Gemini 3 Pro et de Deep Think, voici que débarque Gemini 3 Flash, une version qui revendique une intelligence de « frontière » et une vélocité qui ferait pâlir un processeur survolté. L’entreprise de Mountain View présente ce modèle comme « le plus rapide et le plus économique » de sa galaxie d’IA, tout en assurant qu’il conserve la puissance de raisonnement de ses aînés.
Gemini 3 Flash a été conçu pour que la vitesse ne soit plus synonyme de superficialité. Le modèle, qui repose sur la même architecture que Gemini 3 Pro, atteint des performances qui rivalisent avec les géants du secteur. Sur le fameux benchmark GPQA Diamond, il affiche un score de 90,4 %, tandis que sur Humanity’s Last Exam, il grimpe à 33,7 % sans recours à des outils externes. Autrement dit, il se hisse au niveau de GPT 5.2, tout en surpassant l’ancien 2.5 Pro. Et ce n’est pas tout ! Sur le test MMMU Pro, qui évalue la compréhension multimodale, il décroche un impressionnant 81,2 %, soit une égalité quasi parfaite avec Gemini 3 Pro.
Le secret de ce petit bolide ? Une optimisation qui lui permet d’utiliser en moyenne 30 % de jetons en moins que le 2.5 Pro pour accomplir les mêmes tâches, tout en étant trois fois plus rapide selon les mesures internes de Google. Le tarif a été fixé à 0,50 dollar pour un million de jetons en entrée et 3 dollars pour un million en sortie, ce qui en fait une solution que Google qualifie de « workhorse » pour les entreprises qui traitent des volumes massifs de données.
Les développeurs ne sont pas oubliés. Gemini 3 Flash est déjà disponible dans Google AI Studio, Vertex AI, Gemini Enterprise, Android Studio, Antigravity et même via le Gemini CLI. Il a obtenu un score de 78 % sur le benchmark SWE‑bench Verified, qui mesure la capacité d’un agent à corriger du code, soit un résultat supérieur à celui du 2.5 Pro et proche du niveau de GPT 5.2. De quoi séduire les équipes de JetBrains, Figma, Bridgewater Associates ou encore Cursor, qui l’ont déjà intégré à leurs flux de travail.
Pour le grand public, la nouveauté est tout aussi spectaculaire. Gemini 3 Flash devient le modèle par défaut dans l’application Gemini et dans le mode IA de la recherche Google. Les utilisateurs peuvent donc profiter sans surcoût d’une IA capable d’analyser une vidéo de pickleball, de comprendre un croquis ou de générer un quiz à partir d’un enregistrement audio. L’outil est aussi capable de créer des prototypes d’applications à la voix, sans que l’utilisateur ait besoin de coder.
Google insiste sur le fait que Gemini 3 Flash ne se contente pas de répondre vite, de toutes évidences, il comprend mieux les intentions de l’utilisateur et produit des réponses enrichies d’éléments visuels comme des tableaux ou des images. L’expérience de recherche devient alors un mélange d’analyse et d’action immédiate, puisque l’IA organise les informations en temps réel tout en proposant des recommandations contextualisées.
Cette sortie intervient dans un climat de compétition féroce avec OpenAI. La firme de Sam Altman a récemment lancé GPT 5.2, mais Google revendique déjà un traitement de plus d’un trillion de jetons par jour sur son API. Tulsee Doshi, responsable produit des modèles Gemini, a confié que « ces modèles se défient mutuellement et repoussent sans cesse les limites ». Une déclaration qui sonne comme un avertissement amical à la concurrence… ou plutôt comme une promesse que la bataille de la vitesse ne fait que commencer.

