Avec Gemma 2, Google tente d’allier portabilité et puissance. Une équation difficile à résoudre qui mérite une analyse approfondie.
Au début du mois d’août, pas de répit lorsqu’on est en train de courir un marathon contre Meta, Microsoft, OpenAI… Google vient annoncer l’arrivée de Gemma 2, son nouveau modèle d’intelligence artificielle élaboré pour s’adapter sur les appareils mobiles et notamment les smartphones.
Gemma 2 pour les appareils mobiles
L’annonce va probablement faire grand bruit dans les médias locaux et du monde. Il convient par ailleurs de prendre du recul face aux multiples engagements du géant de la technologie. Gemma 2 est perçue comme une petite innovation. Il s’agit d’un modèle d’IA capable de tenir dans un téléphone mobile tout en se mesurant à des systèmes bien plus performants tels que GPT-3.5.
En réalité, Gemma 2 est un type de langage composé de deux milliards de paramètres. C’est véritablement peu comparé aux divers paramètres des modèles les plus développés. En revanche, attention à ne pas tomber dans des comparaisons irréfléchies. La taille d’un système n’est pas le seul facteur de performance.
La technique adoptée par Google pour Gemma 2
Google affirme avoir adopté une méthode appelée « distillation » pour compacter les connaissances de systèmes plus robustes dans Gemma 2. C’est une approche optimale, mais qui a ses insuffisances. La distillation favorise bien entendu la réduction de la taille d’un modèle, mais souvent en compensation d’une perte de flexibilité et de nuance. Il faut donc garder la tête froide face aux allégations de performances « identiques » à des modèles bien plus performants.
Les graphiques proposés par Google sont certes exceptionnels, mais il faut rappeler que les benchmarks en IA sont souvent élaborés pour mettre en exergue certains aspects spéciaux d’un modèle donné. La réalité de l’usage quotidien pourrait se révéler bien différente.
L’IA embarquée : un horizon encore plus avancé
L’ambition de disposer d’un assistant IA ultra-impactant directement sur nos téléphones mobiles (et nos ordinateurs) est intéressante, mais la réalité est plus contrastée. Même si Gemma 2 est connue comme une innovation, seule une petite partie des smartphones sur le marché actuel serait en mesure de le faire avancer de façon fluide. On parle ici des téléphones mobiles haut de gamme ou les dernières sorties, qui ne constituent qu’une infirme partie du parc mondial.
Pour la plupart des utilisateurs, l’IA élaborée sur le cloud demeurera la norme pendant longtemps. Les limitations en matière d’autonomie, de gestion thermique des téléphones et de puissance d’évaluation sont autant de barrages qui ne se franchiront pas aussi facilement. Il est possible de jouer avec le nouveau modèle Gemma 2 2B, mais directement sur Google AI Studio. Il est accessible via Ollama et il peut ainsi fonctionner sur Mac et PC.
Les avancées technologiques derrière Google Gemma 2 2B
D’après Google, Gemma 2 2B dispose « des meilleurs rendements de sa catégorie pour sa taille, dépassant ainsi de loin les autres modèles ouverts de sa génération ». Toute cette amélioration a été possible grâce à la distillation. Celle-ci représente une technique mise en place 2015 par Geoffrey Hinton. En s’inspirant de modèles plus avancés, cette astuce de formation enseignant-élève permet de concevoir des modèles plus compressés et plus petits.
En élaborant, Gemma 2 2B, Google entame son avancement vers des types d’IA plus légers et petits. Ils sont en mesure de fonctionner sur une diversité de machines. En dehors des modèles récents tels que GPT-4, d’OpenAI, GPT-3.5, Google Gemma 2 2B peut convenablement s’adapter aux smartphones.