dimanche, novembre 17, 2024

Pourquoi les algorithmes sont-ils toujours aussi mauvais pour recommander des livres ?

Ce contenu contient des liens affiliés. Lorsque vous achetez via ces liens, nous pouvons gagner une commission d’affiliation.

L’avènement des algorithmes d’apprentissage automatique dans l’édition a inauguré l’ère des recommandations de livres en ligne. Il y a d’abord eu Goodreads, puis Amazon. Et maintenant, il y a Tertulia, qui récupère une quantité excessive de données publiques pour recommander des livres à ses utilisateurs. Il en existe également d’autres qui fonctionnent de la même manière, qu’il s’agisse d’une application ou d’un site Web. Cependant, même avec leur prévalence de nos jours, les algorithmes font encore beaucoup d’erreurs, et vous réfléchiriez à deux fois avant de les utiliser lorsque vous creusez plus profondément et découvrez ses limites.

Mais avant d’en arriver là, découvrons comment cette technologie fonctionne.

Comment fonctionnent les systèmes de recommandation

Les systèmes d’apprentissage automatique appelés systèmes de recommandation, ou systèmes de recommandation, utilisent des données pour aider les utilisateurs à trouver de nouveaux produits et services. Ces algorithmes alimentent les suggestions que nous consommons probablement, comme celles de la page « Pour vous » de TikTok, les recommandations de vidéos YouTube, les listes de lecture Spotify, les suggestions de films et de séries télévisées Netflix, les recommandations de produits Amazon, les recommandations de livres Goodreads et d’autres services similaires.

Ces algorithmes, cependant, ont besoin d’un bon quantité de données de choisir une stratégie de recommandation afin de produire des recommandations significatives et personnalisées. Ces données peuvent inclure des historiques d’achats passés, des données contextuelles, des données liées à l’entreprise, des informations basées sur le profil de l’utilisateur sur les produits ou des informations basées sur le contenu. Ensuite, tous ces éléments sont combinés et analysés à l’aide de modèles d’intelligence artificielle afin que le système de recommandation puisse prédire ce que des utilisateurs similaires feront à l’avenir.

Un utilisateur peut obtenir une recommandation par le biais de ce qu’il appelle un « filtrage collaboratif ». La plupart des systèmes de recommandation démarrent souvent sans aucune donnée, car ce type de filtrage nécessite beaucoup d’informations pour produire des informations utiles. suggestions. Par exemple, le système doit attendre que quelqu’un regarde un certain nombre de vidéos sur YouTube avant de faire les bonnes recommandations à l’utilisateur.

La méthode la plus précise pour gérer cela est peut-être le « filtrage basé sur le contenu », qui est une analyse en temps réel du comportement d’un utilisateur. Il prend en compte les caractéristiques du produit telles que la taille, la description, la couleur et le prix. L’algorithme présente alors des produits similaires qui sont plus susceptibles d’être ajoutés au panier et achetés. Vous le remarquerez peut-être lorsque vous verrez des « produits susceptibles de vous plaire » sur une page de paiement.

Comment fonctionnent les recommandations Goodreads ?

Afin de prédire avec plus de précision quels livres les lecteurs aimeront lire ensuite, Goodreads indique que son moteur de recommandation combine de nombreux algorithmes propriétaires et prétend analyser 20 milliards de points de données. En examinant la fréquence à laquelle les livres sont trouvés sur les mêmes étagères et si les mêmes lecteurs les ont appréciés, il crée une carte des relations entre les livres. Grâce à sa connaissance des livres stockés sur les étagères d’un utilisateur, Goodreads peut déterminer en quoi les goûts d’un utilisateur diffèrent ou sont similaires à ceux des autres utilisateurs.

Goodreads peut alors combiner des techniques de filtrage collaboratives et basées sur le contenu. Le filtrage collaboratif s’appuie sur les connaissances du groupe pour créer des suggestions basées sur les utilisateurs qui partagent des intérêts similaires, tandis que le filtrage basé sur le contenu prend en compte à la fois les attributs du livre et les attributs de l’utilisateur.

L’objectif fondamental de Le système de recommandation de Goodreads est d’amener autant de personnes que possible à évaluer les livres, ce qui lui permet de déterminer quels livres sont les plus populaires et les types de livres que les lecteurs trouveraient intéressants. Par exemple, si un utilisateur évalue Habitudes atomiques par James Clear avec cinq étoiles brillantes, Bonnes lectures peut suggérer un autre livre de Clear ou un livre lu par d’autres qui ont aimé Habitudes atomiques.

Goodreads enregistre également une pléthore d’informations, y compris les interactions de groupe, les conversations, les activités Demandez à l’auteur, les quiz et les anecdotes. Toutes ces informations peuvent être utiles pour développer un livre solide recommandation système.

En un mot, les utilisateurs de Goodreads représentent une partie importante des données.

Les pièges des systèmes de recommandation tels que celui de Goodreads

Le limites du filtrage basé sur le contenu incluent son incapacité à comprendre les intérêts des utilisateurs au-delà des simples préférences. Il sait quelques trucs de base sur moi, mais c’est tout ce qu’il peut faire. Et s’il recommande un livre raciste ? Et s’il recommande un livre qui pourrait déclencher des lecteurs sans avertissement ? Et s’il recommande un livre qui pose problème ? Le mot clé est nuanceret les algorithmes ne peuvent pas faire la différence entre deux livres qui ont des histoires similaires.

Dans le propre Book Riot Recommandations de livres sur mesure, un service de recommandation de livres, les bibliologues vérifient s’il y a du contenu qui pourrait être potentiellement sensible pour les lecteurs. Il y a beaucoup de travail minutieux effectué dans les coulisses, et ce niveau de sophistication ne peut être égalé par un système d’apprentissage automatique.

Le filtrage basé sur le contenu suggère également des produits en fonction de la concordance des descriptions et des fonctionnalités, et tient également compte des achats antérieurs de l’utilisateur. Cependant, cela crée un « bulle de filtre » Et un « chambre d’écho» qui ignore les intérêts de l’utilisateur en lui suggérant des produits similaires à ceux qu’il a déjà consommés. En ce qui concerne les livres, si j’évalue un livre d’un auteur blanc avec cinq étoiles, le système peut m’enfermer dans cette bulle en continuant à me recommander davantage d’auteurs blancs ; Je ne serai pas exposé à des auteurs issus de milieux marginalisés.

Pendant ce temps, les algorithmes ont besoin de données utilisateur pour suggérer des produits, et il y a un problème habituel avec le filtrage collaboratif : un « démarrage à froid.” Le filtrage basé sur le contenu n’a pas ce problème car il n’a besoin que des préférences de l’utilisateur et des informations sur le produit. Mais avec le filtrage collaboratif, il peut être difficile de recommander quelque chose d’utile aux nouveaux utilisateurs, car il n’y a pas de puits de données à exploiter. Après avoir souscrit à un service, l’algorithme prend du temps pour apprendre ses habitudes de lecture, se souvenir des préférences, analyser les goûts, etc. Pour être en mesure d’atteindre son plein potentiel, il a besoin d’une mine d’or de données à extraire, de sorte qu’il ne donnera pas de recommandations précises pendant un certain temps – si jamais il le fait.

Goodreads fait face à ce problème mais propose également une solution. Pour améliorer son recommandation algorithme, il vous demande de faire beaucoup de choses, comme évaluer des livres, mettre à jour vos genres préférés et créer des étagères. Mais c’est simplement admettre qu’ils ont besoin d’une surveillance humaine pour intervenir et faire fonctionner les choses.

Enfin, les systèmes de filtrage collaboratif limitent les recommandations d’éléments non notés, tels que les nouveaux et les obscurs, à ceux qui ont des goûts distinctifs et spécifiques. Cela signifie que, pour la plupart des utilisateurs, les livres nouveaux et inédits ne seront probablement pas beaucoup recommandés car ils ne sont pas encore évalués. Découverte du livre RIP.

Qu’en est-il de l’intelligence artificielle ?

Les algorithmes d’apprentissage automatique sont un sous-ensemble d’IAmais approfondissons les autres sous-ensembles.

ChatGPT, une IA générative utilisant «les réseaux de neurones», a déjà bouleversé de nombreux secteurs, dont celui de l’édition. Il peut faire beaucoup de choses impressionnantes, alors naturellement, beaucoup ont essayé de lui demander des recommandations de livres. Au début, ils sont impressionnés par la qualité des suggestions. Mais en y regardant de plus près, il crache en fait des erreurs, telles que la création de noms d’auteurs ou de livres. Sur ce Message Reddit, beaucoup ont été déçus par la gravité des recommandations que certains ont suggéré de demander plutôt à un bibliothécaire. Un autre utilisateur de Reddit a également fait une telle demande sur ChatGPT, mais il a également été déçu par des erreurs dans noms d’auteurset le chatbot glorifié n’arrêtait pas de répéter un titre de livre même s’il lui était spécifiquement dit de ne pas le faire.

Ces incidents soulignent la réalité que ChatGPT est vraiment génial pour conneries alors qu’en fait, il ne sait pas vraiment ce qu’il dit. Et si vous insistez pour l’utiliser pour demander des livres à lire, sachez simplement qu’il n’a pas reçu de données de À partir d’octobre 2021, de sorte que les livres publiés à cette époque ne seront pas mentionnés du tout. Et voici une autre mauvaise nouvelle : étant donné que les outils d’IA comme ChatGPT ont été alimentés à maintes reprises avec du contenu en anglais, « [they] peut offrir de manière disproportionnée les préférences des internet anglophone.” Cela signifie qu’il saute beaucoup de grands livres d’autres langues et d’autres pays.


Est-ce que tous les pièges des algorithmes – et de l’IA en général – il semble que rien ne vaut les recommandations de livres faites par un être humain réel. Ils sont plus précis et plus personnels. Surtout, vous pouvez également trouver des joyaux cachés que vous aimez vraiment plutôt que les best-sellers (et ce que tout le monde lit) que ces systèmes d’apprentissage automatique crachent toujours.

Cela dit, vous voudrez peut-être vérifier TBR.co pour des recommandations personnalisées.

Source link-24

- Advertisement -

Latest