La transition vers Gemini, le nouvel assistant de Google, marque une avancée significative dans l’intelligence artificielle. Avec des capacités linguistiques améliorées et des interactions plus naturelles, Gemini surpasse même Siri. Une des fonctionnalités innovantes, les aperçus audio, permet de transformer des documents en podcasts dynamiques, facilitant l’apprentissage et la compréhension. Cette approche sensorielle, qui combine écoute et interaction, favorise la mémoire et l’engagement, rendant l’accès à l’information plus pratique, surtout dans des situations comme les trajets quotidiens.
La transition de Google Assistant vers l’ère Gemini est sur le point d’atteindre sa conclusion. Bien que l’on puisse ressentir une certaine nostalgie pour l’ancien assistant virtuel, l’arrivée de Gemini a véritablement redéfini les capacités d’un agent d’intelligence artificielle.
Avec Gemini, les compétences en compréhension linguistique ont atteint un tout nouveau niveau. Les échanges sont plus naturels, les interactions avec les applications sont simplifiées, et l’intégration avec d’autres produits Google est enrichissante. Même dans sa version gratuite, Gemini surpasse Siri, même sur un iPhone.
Cependant, certaines fonctionnalités placent Gemini dans une catégorie à part. Parmi celles-ci, la recherche approfondie est un outil que j’utilise quotidiennement et qui m’émerveille continuellement. En mars, Google a ajouté une fonctionnalité intéressante à Gemini : les aperçus audio.
Transformer le contenu en podcast
Pensez à la possibilité de transformer vos documents ennuyeux, vos articles de recherche complexes ou votre lecture académique en une conversation dynamique de podcast. C’est précisément ce que permettent les aperçus audio. Cette fonctionnalité a d’abord été introduite sur NotebookLM de Google, souvent sous-estimé, et a enfin été intégrée à l’expérience principale de Gemini sur mobile et web.
Pas besoin de manipulations techniques ou d’écrire des instructions textuelles précises pour bénéficier de ces transformations audio. Il vous suffit de télécharger un fichier via le sélecteur de pièces jointes, et vous verrez apparaître une option « Générer un aperçu audio » au-dessus de la boîte de chat. En cliquant dessus, la création du podcast commence.
Ce processus peut prendre quelques minutes, mais vous pouvez naviguer vers une autre application ou fenêtre pendant ce temps. Une fois le podcast prêt, vous recevrez une notification pour écouter ou partager votre création audio.
Les aperçus audio se présentent généralement sous la forme d’une conversation fluide et naturelle. Cela donne l’impression d’interagir avec Gemini en direct, qui semble beaucoup plus engageant que n’importe quel chatbot IA que j’ai testé jusqu’à présent en mode conversation vocale.
Les podcasts générés par IA sont généralement bien réalisés. Personnellement, je les apprécie pour plusieurs raisons. En effet, je passe la majeure partie de ma journée devant un écran, à lire des articles pour la recherche et à rédiger mes propres écrits.
Cette situation laisse peu de place pour interagir avec d’autres contenus textuels, qu’ils soient académiques, professionnels ou même récréatifs. Toutefois, en changeant simplement de mode sensoriel pour aborder ce matériel, ma fatigue de lecture devient moins pesante.
Les podcasts audio offrent une manière innovante de s’immerger dans le matériel textuel. Cela nous amène à un second avantage : la stimulation sensorielle. Cette approche a été largement étudiée et éprouvée dans les domaines académique et professionnel.
Comment cela m’a été bénéfique
La fatigue liée à la lecture a ses propres conséquences. Elle transforme même les tâches les plus passionnantes en corvées que l’on doit surmonter, simplement parce qu’on ne peut se permettre de ne pas les accomplir. Cependant, s’engager avec le même contenu, ou son essence, à travers un autre format sensoriel peut atténuer cette surcharge de texte. Cela présente également d’autres avantages.
« L’implication de plusieurs sens renforce la mémoire. Lorsque nous écoutons et interagissons, que ce soit par la lecture, l’écriture, ou d’autres activités, notre cerveau crée des connexions plus solides, facilitant ainsi le rappel ultérieur », explique Yasir Naseem, expert en linguistique, dont les recherches portent sur la modernisation des méthodes d’enseignement.
Naseem, actuellement expert en curriculum dans une entreprise de technologie éducative de premier plan, souligne qu’il est essentiel de ne pas se limiter à un seul format pour apprendre. Il recommande de combiner plusieurs méthodes pour optimiser l’apprentissage, allant de l’expérience sensorielle à la rétention de l’information.
Une recherche publiée dans le journal Computers & Education a également mis en évidence que les étudiants préféraient les fichiers audio pour l’apprentissage et la révision. La flexibilité et la diversité sensorielle sont des facteurs clés dans leur préférence pour les podcasts par rapport à d’autres formats.
« Une véritable compréhension et une rétention à long terme se produisent lorsque l’écoute est associée à des éléments visuels, des discussions ou des activités pratiques », ajoute Naseem. Mes propres expériences avec les aperçus audio de Gemini confirment ses observations.
Ces podcasts audio ne se contentent pas de convertir du texte en audio. Ils transforment un mur de texte souvent monotone en une conversation engageante dont vous êtes essentiellement l’auditeur exclusif. C’est un atout précieux pour tout contenu textuel qui ne suscite pas immédiatement votre intérêt.
Dans ma dernière expérience, le podcast audio de Gemini m’a permis de saisir l’importance d’un article traitant « d’un cadre pour un apprentissage neuronal interprétable basé sur des fonctions d’objectif théoriques de l’information locales ». En d’autres termes, l’article discutait de l’organisation des cellules nerveuses.
Vous comprenez bien l’idée que je tente de transmettre ici, n’est-ce pas ?
La commodité avant tout
La commodité est cruciale lorsqu’il s’agit d’absorber des informations. Elle influe également sur l’enthousiasme et l’excitation tout au long du processus d’apprentissage. Selon une étude publiée dans le journal Computers in Human Behavior, les podcasts « améliorent la commodité, la flexibilité et l’accessibilité à l’information et à la connaissance ». J’ai rapidement constaté cette vérité.
Résidant dans la capitale nationale, je passe entre 2 et 3 heures par jour coincé dans le trafic ou les transports en commun. Au-delà de l’inconfort, c’est surtout le temps perdu qui est frustrant. Le matériel audio d’apprentissage constitue un moyen pratique d’utiliser ce temps de manière productive.
Avec Gemini, vous bénéficiez d’un avantage supplémentaire. Vous n’avez pas besoin de vous fier à la disponibilité audio d’un