JDWJDW
Font ResizerAa
  • Tech & Innovations
  • Mobiles & Apps
  • IA & Robotique
  • Consoles & Jeux Vidéo
  • Films & Séries
  • Animes & Mangas
  • Blockchain & Crypto
  • Plus
    • Web & Internet
    • Geek & Gadgets
    • Informatique & Cybersécurité
    • Sciences & Espace
    • Réseaux Sociaux & Influence
    • e-Business & Webmarketing
    • Fintech & Néobanques
    • Streaming & P2P
Font ResizerAa
JDWJDW
Rechercher
  • Web & Internet
  • Tech & Innovations
  • Mobiles & Apps
  • Consoles & Jeux Vidéo
  • Films & Séries
  • Animes & Mangas
  • Blockchain & Crypto
  • Geek & Gadgets
  • Informatique & Cybersécurité
  • Streaming & P2P
Avez-vous déjà un compte ? Sign In
Suivez-nous
Tech & Innovations

OpenAI AI Voices : Trois nouveaux modèles pour la transcription et les voix synthétiques

Darell Mertens
Published: 23 mars 2025
Last updated: 23 mars 2025
Partager
openai audio model

Trois nouvelles voix IA signées OpenAI sont là. Ça fait un moment qu’ils bossent dessus, et malgré quelques petits scandales, ils n’ont pas ralenti la cadence.

OpenAI a lancé gpt-4o-transcribe, gpt-4o-mini-transcribe et gpt-4o-mini-tts. Des noms qui ne font pas rêver, mais des technos qui promettent. Ces outils servent à la transcription et à la génération vocale via API, donc surtout pour les développeurs et leurs applis tierces. Les curieux peuvent aussi tester sur OpenAI.fm, un site démo où on peut jouer avec les voix sans coder une seule ligne.

La vraie nouveauté : il est possible de personnaliser ces voix selon ses envies. Un accent anglais bien posé ? Une intonation dramatique ? Une voix apaisante façon prof de yoga zen ? Tout ça se règle d’un simple prompt texte.

Jeff Harris, ingénieur chez OpenAI, a montré en live à VentureBeat comment une même voix pouvait passer du savant fou au coach méditatif rien qu’avec quelques instructions écrites. L’idée derrière tout ça : éviter que quelqu’un puisse dire que l’IA copie une voix existante… même si l’affaire Johansson a prouvé que le sujet reste sensible.

Plus précis que Whisper

Ces modèles reprennent la base du GPT-4o sorti en mai 2024 mais ont été entraînés spécifiquement pour exceller dans tout ce qui touche à la parole et sa transcription. Le but est clair : remplacer Whisper, le précédent modèle open source lancé par OpenAI il y a deux ans.

A lire également

gpt-5.4 vs opus 4.7
GPT-5.4 vs Claude Opus 4.7 : le duel des titans de l’IA décrypté benchmark par benchmark
robot humanoide marathon
Un robot humanoïde pulvérise le record du semi-marathon
Claude AI
Anthropic (Claude) et Amazon scellent un pacte titanesque de 100 milliards de dollars

Les améliorations sont notables :

  • Moins d’erreurs dans les retranscriptions
  • Meilleure reconnaissance des accents
  • Fonctionne mieux dans le bruit ambiant

Un graphique publié par OpenAI montre que gpt-4o-transcribe descend jusqu’à un taux d’erreur de seulement 2,46% en anglais sur un large panel de tests industriels.

Harris précise aussi que ces modèles détectent mieux quand quelqu’un termine une phrase grâce à un « détecteur d’activité sémantique ». Dit autrement, il en sera fini des coupures hasardeuses ou les phrases tronquées lors des retranscriptions automatiques.

Mais petite limite quand même : ils ne savent pas différencier plusieurs intervenants dans une conversation (« diarization » absente). Si plusieurs personnes parlent en même temps ou se relaient rapidement… eh bien ce sera pris comme une seule grande phrase continue.

Si vous gérez un service client automatisé ou voulez juste éviter de prendre des notes en réunion, ces nouveaux outils ont clairement leur place. L’intégration est facile : neuf lignes de code suffisent pour ajouter ces fonctionnalités vocales aux applis basées sur GPT-4o classique.

Prix & accès immédiat

Pas besoin d’attendre pour essayer ces nouveaux outils :

  • gpt-4o-transcribe → $6 / million de tokens audio (~$0.006/minute)
  • gpt-4o-mini-transcribe → $3 / million (~$0.003/minute)
  • gpt-4o-mini-tts → $0.60 / million tokens texte & $12 / million tokens audio (~$0.015/minute)

Côté rapports qualité/prix face aux concurrents comme ElevenLabs ou Hume AI… disons que chacun a ses avantages selon l’usage recherché , certains préfèreront payer moins cher quitte à perdre légèrement en précision ou fonctionnalités spécifiques comme le multi-haut-parleur.

Et afin de rendre le lancement plus fun, OpenAI organise aussi un petit concours autour du site démo OpenAI.fm. Ceux qui partageront les créations vocales les plus originales sur X (@openai) pourraient gagner… une radio customisée Teenage Engineering. Pas sûr que ça change votre vie mais … il n’y en aurait que trois exemplaires au monde.

Sources :OpenAI
Partager cet article
Facebook Whatsapp Whatsapp LinkedIn Reddit Telegram Copy Link

Derniers articles

Conceptual digital art, futuristic AI consciousness debate visualized as a sleek black neural circuit map split by a glo
L’IA ne sera jamais consciente : un chercheur de Google DeepMind plante le drapeau
IA & Robotique
Solana
Solana Alpenglow : la refonte la plus ambitieuse de l’histoire du réseau entre en phase de test
Blockchain & Crypto
crypto-monnaies forex arnaques
Crypto-monnaies & Forex : Enquête sur ces arnaques au trading via robots IA qui vident vos comptes
Blockchain & Crypto Web & Internet
Gain Generator Pro Arnaque
Avis Gain Generator Pro : Arnaque ou robot de trading fiable ?

Tendance

eToro
Avis eToro 2026 : Courtier sérieux ou arnaque ? Notre test complet
Bitcoin
Qu’est-ce que le Bitcoin ? Le guide complet 2026 (de Satoshi à Wall Street)
Blockchain & Crypto
Bit GPT App arnaque
Avis Bit GPT App : véritable arnaque ou service légitime ?
Coco Chat - Cocoland
Cocoland, le fantôme de Coco chat : le site renaît et la justice tente de suivre
Web & Internet
Modern editorial photography, secret Pentagon declassification scene, a stack of heavily redacted government files on a
Divulgation Ovni : les premiers documents déclassifiés du gouvernement américain attendus à 14 heures
Sciences & Espace

Vous allez aussi aimer

Apple Vision Pro
Tech & Innovations

Apple annonce l’Apple Vision Pro ! Une révolution dans le monde de la réalité augmentée

6 juin 2023
google ai
Tech & Innovations

Google négocie avec Marvell pour concevoir deux puces IA : une offensive frontale contre Nvidia

20 avril 2026
Illustration éditoriale réaliste et moderne sur l’intelligence artificielle dans les réseaux sensibles de l’État : inter
Informatique & CybersécuritéTech & Innovations

IA et réseaux sensibles de l’État : pourquoi l’affaire Grok au Pentagone inquiète déjà Washington

16 mars 2026
Undetectable AI
Tech & Innovations

Avis sur Undetectable.ai : un « humanizer » fiable ou simple arnaque ?

1 sur 5Très mauvais
Openai o1
Tech & Innovations

Openai lance o1, son nouveau modèle d’IA « capable de raisonner »

13 septembre 2024
deepseek
Tech & Innovations

DeepSeek échoue à entraîner son modèle R2 sur les puces Huawei

15 août 2025
tubi
Streaming & P2PTech & Innovations

Tubi lance une app native dans ChatGPT : le streaming gratuit entre dans l’ère de la découverte conversationnelle

13 avril 2026
Asus NUC 14 Pro AI
Informatique & CybersécuritéTech & Innovations

Asus NUC 14 Pro AI : un mini PC qui ne fait pas les choses à moitié

29 juillet 2025

Infos légales

  • Mentions légales
  • Politique de confidentialité
  • Nous contacter
  • Partenaires

Maj récentes

binance
Binance lance Withdraw Protection : le coffre-fort anti-agression physique
Blockchain & Crypto
cz binance
Binance : CZ envisage un retour sur le marché américain et mise sur l’intelligence artificielle
Blockchain & Crypto
ios 26.5
iOS 26.5 RC : Apple lâche la version finale de test avant le grand lancement
Mobiles & Apps
GTA 6
GTA 6 aurait déjà couté entre 1 et 1,5 milliard de dollars à Rockstar Games
Consoles & Jeux Vidéo

Qui sommes nous ?

Le Journal du Web alias JDW a été fondé et est édité par des passionnés par l’univers web, nouvelles technologies et de la culture populaire.

Newsletter
Inscrivez-vous à notre newsletter pour recevoir nos derniers articles!
Suivez-nous
Welcome Back!

Sign in to your account

Username or Email Address
Password

Mot de passe oublié ?