La version 18.2 d'iOS récemment publiée apporte enfin de nombreuses fonctions d'Apple Intelligence promises, telles que Genmoji et Image Playground. L'un de ces outils tant attendus est Visual Intelligence, une fonction actuellement réservée à l'iPhone 16 Pro et Pro Max et qui a été présentée pour la première fois lors de l'événement Apple de septembre.
Qu'est-ce que l'intelligence visuelle ?
Visual Intelligence est la réponse d'Apple à Google Lens. Elle utilise le système de caméra et l'intelligence artificielle pour analyser les images en temps réel et fournir des informations utiles. Cela peut aider les gens à en savoir plus sur le monde qui les entoure et est particulièrement utile pour faire des achats, rechercher des détails sur un restaurant ou une entreprise, traduire des textes écrits, résumer des textes ou lire des textes à haute voix. Il peut également être intégré à Google Recherche d'images et à ChatGPT.
Y a-t-il des restrictions ?
Il y a deux restrictions. Le lancement d'Apple Intelligence a été assez confus, et cette tendance se poursuit avec Visual Intelligence. Pour le moment, les outils ne fonctionnent qu'avec l'iPhone 16 Pro et Pro Max, les plus puissants des derniers téléphones portables d'Apple. Apple a laissé entendre que la fonctionnalité pourrait être disponible pour les modèles plus anciens. Google Lens existe depuis 2017, lorsque le Pixel 2 était le téléphone le plus en vogue sur le marché.
Comme pour toutes les fonctions d'Apple Intelligence, il existe une liste d'attente. Pour vous inscrire sur cette liste, allez dans les réglages et cherchez "Apple Intelligence & Siri". Cliquez ensuite sur "Ajouter à la liste d'attente". Une fois que vous êtes sur la liste, vous pouvez utiliser le logiciel.
Comment utiliser Visual Intelligence ?
La seule façon de lancer Visual Intelligence est actuellement d'appuyer longuement sur le bouton de commande de la caméra. Il s'agit de la nouvelle interface de contrôle située en bas à droite de l'appareil. Dès que vous appuyez sur ce bouton, l'interface Visual Intelligence s'ouvre.
C'est maintenant que le plaisir commence. Il suffit de pointer votre téléphone vers quelque chose et de sélectionner ChatGPT via l'icône en bas à gauche ou Google Recherche d'images via l'icône en bas à droite. Si le champ de vision contient du texte, vous pouvez également appuyer sur le cercle en bas de l'écran. Vous pouvez également pointer votre téléphone vers une entreprise pour obtenir des informations utiles.
Comment interagir avec le texte
Placez le téléphone devant le texte, activez Visual Intelligence et tapez sur le cercle en bas de l'écran. Le texte est ainsi analysé. Après l'analyse, plusieurs options sont à votre disposition. Tapez sur "Traduire" en bas de l'écran pour traduire le texte dans une autre langue. Touchez "Lire" pour faire lire le texte par Siri. Touchez "Résumé" pour obtenir un bref résumé du texte.
L'outil reconnaît également les informations de contact dans le texte, comme les numéros de téléphone, les adresses électroniques et les sites web. L'utilisateur peut effectuer différentes actions en fonction du type de texte. Par exemple, il peut appuyer sur le numéro de téléphone pour appeler. D'autres actions sont l'envoi d'un e-mail, la création d'un rendez-vous ou l'accès à un site web. Touchez le bouton "Plus" pour afficher toutes les options disponibles. Appuyez sur "Fermer" ou faites glisser votre doigt vers le haut pour mettre fin à la session.
Interagir avec une entreprise
Avec Visual Intelligence, vous pouvez obtenir des détails sur une entreprise qui se trouve juste devant vous. Il suffit d'ouvrir l'outil et de diriger la caméra vers l'enseigne. Le nom de l'entreprise devrait apparaître en haut de l'écran. Appuyez sur "Heures d'ouverture" pour voir les heures d'ouverture ou sur "Commander" pour acheter quelque chose. Appuyez sur "Menu" pour afficher le menu ou les services disponibles, ou sur "Réservation" pour faire une réservation. Pour appeler l'établissement, lire les avis ou consulter le site web, tapez sur "Plus".
Balayez vers le haut avec votre doigt ou appuyez sur "Fermer" pour mettre fin à la session. Cette fonction n'est actuellement disponible que pour les clients situés aux États-Unis.
Qu'est-ce que je fais avec ChatGPT ?
Tout d'abord, diriger la caméra vers un objet. Activez Visual Intelligence et tapez sur l'icône ChatGPT dans le coin inférieur gauche de l'écran. Tapez sur le bouton "Demander" pour obtenir des informations sur l'objet. Nous l'avons appliqué à une bouteille de crème pour les mains, qu'il a correctement identifiée. Un champ de texte apparaît alors pour poser d'autres questions. Les utilisateurs peuvent demander ce qu'ils veulent, mais les résultats peuvent varier. Nous avons demandé à ChatGPT où il était possible d'acheter la crème pour les mains et combien elle coûtait. Il s'est acquitté de cette tâche avec brio. Youpi, les achats !
Appuyez sur le bouton "Fermer" ou balayez vers le haut avec votre doigt pour supprimer tous les champs et quitter Visual Intelligence.
Qu'est-ce que je fais avec Google Recherche d'Images ?
Lorsque vous sélectionnez Google Recherche d'images, une boîte de dialogue Safari s'affiche avec des photos similaires trouvées sur Internet. Un bon cas d'utilisation est de trouver des offres. Nous avons pris une photo d'une bouteille de crème pour les mains et les résultats de Safari ont proposé de nombreux prix différents à choisir. L'utilisateur doit toutefois trouver lui-même la meilleure offre et conclure l'achat.
Appuyez sur le bouton "Fermer" pour supprimer les résultats, puis balayez vers le haut à partir du bas de l'écran pour quitter l'outil.