Google enrichit Gemini avec l’importation de fichiers audio

Google continue d’étendre les capacités de son intelligence artificielle Gemini en lui permettant désormais d’importer et de traiter des fichiers audio. Cette nouvelle fonctionnalité, très attendue par les utilisateurs, promet de transformer la manière dont les enregistrements sonores sont analysés et utilisés au quotidien.

Les 3 points essentiels à retenir

  • Gemini peut désormais importer et traiter des fichiers audio tels que MP3, M4A et WAV.
  • La fonctionnalité est accessible sur Android, iOS et le Web, avec des options étendues pour les abonnés payants.
  • Google se positionne sur le marché de la transcription automatique, déjà en forte croissance.

Fonctionnalités audio de Gemini

L’application Gemini de Google s’enrichit d’une fonctionnalité qui permet d’importer des fichiers audio courants tels que MP3, M4A et WAV. Cette nouveauté, disponible sur Android, iOS et le Web, permet à l’utilisateur de télécharger un fichier audio, que Gemini transcrit ensuite tout en identifiant les locuteurs et en fournissant un résumé complet.

Avec cette nouvelle capacité, Gemini répond à une forte demande des utilisateurs, comme l’a rappelé Josh Woodward, vice-président de Google Labs. Cette fonctionnalité facilite l’analyse de réunions, d’interviews et de conférences, transformant chaque enregistrement en un document exploitable.

Accès et limites pour les utilisateurs

Google propose cette nouvelle fonction à tous ses utilisateurs, mais avec certaines restrictions. La version gratuite de Gemini permet d’importer des fichiers audio d’une durée maximale de dix minutes. Pour des besoins plus professionnels, les abonnés aux plans Google AI Pro ou Ultra peuvent importer des fichiers allant jusqu’à trois heures.

Chaque utilisateur peut traiter jusqu’à dix fichiers simultanément, que ce soit pour des réunions, des cours ou des podcasts. Les abonnements payants offrent une flexibilité accrue, essentielle pour des utilisateurs tels que les journalistes ou les podcasteurs.

Impact sur le marché de la transcription

Avec l’ajout de cette fonctionnalité, Google entre dans le marché compétitif de la transcription automatique, qui pèse déjà plus de 1,6 milliard de dollars et devrait croître considérablement d’ici 2030. L’arrivée de Google pourrait intensifier la concurrence et potentiellement influencer les prix des solutions de transcription actuellement disponibles.

L’approche de Google, qui consiste à offrir des fonctionnalités de base gratuitement tout en proposant des abonnements pour des usages plus intensifs, s’aligne avec sa stratégie habituelle. Les utilisateurs peuvent ainsi tester les nouvelles fonctionnalités avant de s’engager dans des plans payants adaptés à leurs besoins.

Contexte et perspectives de Google Gemini

Gemini, l’intelligence artificielle de Google, a été conçue pour être un outil multimodal, capable de traiter du texte, des images, des vidéos et des sons. L’ajout de la capacité à comprendre et transcrire des fichiers audio renforce encore davantage sa polyvalence. Google, en intégrant cette fonctionnalité, continue d’étendre l’écosystème de ses produits d’IA, cherchant à offrir des solutions complètes et intégrées pour divers besoins professionnels et personnels.

Depuis son lancement, Gemini s’affirme comme un compétiteur sérieux sur le marché de l’IA, en constante évolution. En enrichissant régulièrement ses fonctionnalités, Google démontre son engagement à innover et à répondre aux attentes des utilisateurs, tout en explorant de nouvelles opportunités commerciales.

[Nouveau] 4 ebooks sur le digital marketing à télécharger gratuitement

Cet article vous a plu ? Recevez nos prochains articles par mail

Inscrivez-vous à notre newsletter, et vous recevrez un mail tous les jeudis avec les derniers articles d’experts publiés.

D’autres articles sur le même thème :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *