Les outils d'IA générative de Google bénéficient de quelques-unes des nouveautés annoncées par l'entreprise lors de la Google I/O. À partir de cette semaine, l'entreprise présentera la prochaine version de son générateur d'images Imagen, qui (après une controverse embarrassante en début d'année) permettra à nouveau de créer des humains IA. Le chatbot Gemini de Google sera également complété par Gems, la version de l'entreprise pour les bots avec des instructions personnalisées, similaires aux GPT personnalisées de ChatGPT.
Imagen 3 de Google est la version mise à jour de son générateur d'images intégré à Gemini. L'entreprise affirme que le modèle d'IA de nouvelle génération "établit une nouvelle norme de qualité d'image" et est doté de garde-fous pour éviter une surcorrection pour la diversité, comme les images d'IA historiques bizarres qui sont devenues virales au début de l'année.
"Dans une série de benchmarks, Imagen 3 obtient de très bons résultats par rapport à d'autres modèles de traitement d'images disponibles", écrit le chef de produit de Gemini, Dave Citron, dans un communiqué de presse. L'outil permet de contrôler la génération d'images avec des invites supplémentaires si l'on n'est pas satisfait du résultat.
Selon Citron, Imagen 3 "s'en sort bien" par rapport à la concurrence. Il comprend également l'outil SynthID de Google, qui permet d'ajouter des filigranes aux images pour indiquer clairement qu'il s'agit d'images d'IA et non de vraies images.
Citron affirme que la possibilité de générer des personnes reviendra dans les prochains jours pour les utilisateurs payants, des mois après que Google ait supprimé cette fonctionnalité. Il affirme que de nouvelles directives empêcheront la création d'"individus photoréalistes et identifiables" - bien loin des deepfakes problématiques créés par Grok d'Elon Musk. Les enfants et (comme pour d'autres générateurs d'images) les scènes sanglantes, violentes ou sexuelles sont également tabous. Le chef de produit tempère les attentes en déclarant que les images de Gemini ne seront pas parfaites, mais il promet que l'entreprise continuera d'écouter les commentaires des utilisateurs et d'améliorer le logiciel en conséquence.
À partir de cette semaine, Imagen 3 sera disponible pour tous les utilisateurs, mais la réintroduction des images avec des personnes commencera avec les utilisateurs payants. Les utilisateurs anglophones de Gemini Advanced, Business et Enterprise peuvent s'attendre à la réintroduction des images avec personnes "dans les prochains jours".
Les Gems, présentés pour la première fois lors de la Google I/O 2024, sont les chatbots personnalisés de Google avec des instructions créées par les utilisateurs. Ils sont essentiellement la réponse de Gemini aux GPT d'OpenAI, que le concurrent de Google a lancé à la fin de l'année dernière. Gems sera mis en ligne dans les prochains jours.
"Avec les Gems, vous pouvez constituer une équipe d'experts pour vous aider à réfléchir à un projet difficile, à rassembler des idées pour un événement à venir ou à écrire le titre parfait pour un article dans les médias sociaux", écrit Citron. "Vos Gems peuvent également se souvenir d'instructions détaillées pour gagner du temps lors de tâches fastidieuses, répétitives ou difficiles".
En plus des Gems personnalisés, Gemini comprendra également des Gems prédéfinis "pour vous aider à démarrer" et vous inspirer de nouvelles idées.
Les Gems préfabriqués incluent
- Coach d'apprentissage - pour vous aider à comprendre des sujets complexes
- Brainstormer - pour stimuler de nouvelles idées
- Guide de carrière - vous aide à améliorer vos compétences, vos décisions et vos objectifs
- Writing Editor - donne un feedback constructif sur la grammaire, le ton et la structure
- Coding Partner - améliore les compétences en programmation des développeurs et inspire de nouveaux projets.
Les Gems sont disponibles dès aujourd'hui pour les ordinateurs de bureau et les mobiles. Cependant, ils ne sont disponibles que pour les abonnés Gemini Advanced, Business et Enterprise, ce qui signifie que vous devez souscrire un abonnement payant pour les essayer.