Google affirme que l’exécution de modèles d’IA sur les téléphones est une énorme consommation de RAM

Agrandir / Le logo Google Gémeaux.

Google

Début mars, Google a fait une étrange annonce selon laquelle seul un L’un de ses deux derniers smartphones, le Pixel 8 et le Pixel 8 Pro, serait capable d’exécuter son dernier modèle d’IA, appelé « Google Gemini ». Malgré des spécifications très similaires, le plus petit Pixel 8 n’obtiendrait pas le nouveau modèle d’IA, la société invoquant de mystérieuses « limitations matérielles » comme raison. C’était une déclaration étrange compte tenu du fait que Google a conçu et commercialisé le Pixel 8 pour qu’il soit centré sur l’IA, puis a conçu un modèle d’IA centré sur le smartphone appelé « Gemini Nano », mais ne parvenait toujours pas à faire fonctionner les deux ensemble.

Quelques semaines plus tard, Google fait quelque peu marche arrière. La société a annoncé sur le forum d’aide du Pixel Phone que le plus petit Pixel 8 était en fait volonté Obtenez Gemini Nano dans la prochaine grande version trimestrielle d’Android, qui devrait avoir lieu en juin. Il y a cependant un problème : alors que le Pixel 8 Pro bénéficiera de Gemini Nano en tant que fonctionnalité destinée à l’utilisateur, sur le Pixel 8, il n’est publié que « en tant qu’option de développement ». Cela signifie que vous ne pourrez l’activer que via le menu caché des options de développement dans les paramètres, et la plupart des gens ne le verront pas.

Seang Chau, vice-président des appareils et services logiciels de Google, a expliqué cette décision sur le podcast interne « Made by Google ». « Le Pixel 8 Pro, doté de 12 Go de RAM, était l’endroit idéal pour nous. [Gemini Nano] sur l’appareil et voir ce que nous pourrions faire », a déclaré Chau. « Lorsque nous avons regardé le Pixel 8 comme exemple, le Pixel 8 a 4 Go de mémoire en moins, et ce n’était pas aussi simple d’appeler pour simplement dire : « tous c’est vrai, nous allons également l’activer sur le Pixel 8. » Selon Chau, l’inquiétude de Google est due au fait que la société ne veut pas « dégrader l’expérience » sur le plus petit Pixel 8, qui ne dispose que de 8 Go de RAM.

Chau a ensuite décrit ce que cela signifie d’avoir un grand modèle de langage comme Gemini Nano sur votre téléphone, et il semble que de gros compromis soient impliqués. Google souhaite que certains modèles d’IA soient « résidents en RAM » afin qu’ils soient toujours chargés en mémoire. L’une de ces fonctionnalités est la « réponse intelligente », qui tente de générer automatiquement des réponses textuelles.

Chau a déclaré au podcast : « Smart Reply est quelque chose qui nécessite que les modèles résident dans la RAM afin qu’ils soient disponibles à tout moment. Vous ne voulez pas attendre que le modèle se charge sur une réponse Gboard, nous le gardons donc résident.  » Pour cette raison, Google conserve la réponse intelligente basée sur Gemini derrière un indicateur de développeur pour le Pixel 8 et le Pixel 8 Pro. Les options « Réponse intelligente » dans les paramètres normaux du clavier ne sont pas alimentées par Gemini.

Le plus grand Pixel 8 Pro bénéficie des dernières fonctionnalités d’IA.  Le modèle plus petit le verrouille derrière une option de développement.
Agrandir / Le plus grand Pixel 8 Pro bénéficie des dernières fonctionnalités d’IA. Le modèle plus petit le verrouille derrière une option de développement.

Google

Ainsi, contrairement à une application qui peut être chargée et déchargée au fur et à mesure que vous l’utilisez, exécuter quelque chose comme Gemini Nano pourrait signifier perdre définitivement ce qui est apparemment une grande partie de la mémoire système. La base de 8 Go de RAM pour les téléphones Android devra peut-être être à nouveau augmentée à l’avenir. La note la plus élevée que nous avons vue pour les téléphones est de 24 Go de RAM, et les plus gros produits phares ont généralement 12 Go ou 16 Go de RAM, donc c’est certainement faisable.

Le modèle Gemini Nano de Google est également disponible sur la gamme Galaxy S24, et le modèle de base dispose également de 8 Go de RAM. Lorsque Google a initialement cité les limitations matérielles du Pixel 8 pour expliquer l’absence de cette fonctionnalité, son explication était déroutante : si le modèle de base S24 peut l’exécuter, le Pixel 8 devrait également le pouvoir. Cependant, tout dépend du compromis que vous êtes prêt à faire en termes de mémoire disponible pour les applications. Chau dit que l’équipe « continue à valider l’état du système, car même si vous êtes développeur, vous souhaiterez peut-être utiliser votre téléphone quotidiennement ».

Le problème, cependant, c’est qu’en tant qu’utilisateur, je ne sais même pas si je vouloir Gemini Nano sur mon téléphone. Nous sommes au sommet du cycle de battage médiatique de l’IA générative, et Google a ses propres raisons internes (le marché boursier) pour pousser si fort l’IA. Bien que visiter ChatGPT et lui poser des questions puisse être utile, ce n’est qu’une application. Les fonctionnalités d’IA générative réellement utiles au niveau du système d’exploitation sont rares. Je n’ai pas vraiment besoin d’un clavier pour générer automatiquement des réponses. Si cela doit simplement utiliser beaucoup de RAM qui pourrait être utilisée par les applications, je souhaiterais peut-être le désactiver.

Cet article a été mis à jour le 30 mars après avoir reçu des données supplémentaires de Google PR. Google nous a dit que ni le Pixel 8 ni le Pixel 8 Pro ne gardaient Gemini en mémoire pour le moment, à moins que vous n’activiez l’indicateur de développeur. Cela signifie que par défaut, la fonction de réponse intelligente d’aucun appareil n’est alimentée par Gemini.

Source-147