Intelligenza visiva: la risposta di Apple a Google Lens

Il recente rilascio di iOS 18.2 porta finalmente molte delle funzioni promesse di Apple Intelligence, come Genmoji e Image Playground. Uno di questi strumenti tanto attesi è Visual Intelligence, una funzione attualmente riservata agli iPhone 16 Pro e Pro Max e presentata per la prima volta all'evento Apple di settembre.

Che cos'è l'intelligenza visiva?

Visual Intelligence è la risposta di Apple a Google Lens. Utilizza il sistema della fotocamera e l'intelligenza artificiale per analizzare le immagini in tempo reale e fornire informazioni utili. Questo può aiutare le persone a conoscere meglio il mondo che le circonda ed è particolarmente utile quando si fa shopping, si cercano dettagli su un ristorante o un'attività commerciale, si traduce un testo scritto, si riassume un testo o si legge un testo ad alta voce. Può anche essere integrato in Google Image Search e ChatGPT.

Ci sono restrizioni?

Ci sono due limitazioni. L'introduzione di Apple Intelligence è stata un po' disordinata e questa tendenza continua con Visual Intelligence. Al momento, gli strumenti funzionano solo con l'iPhone 16 Pro e Pro Max, i più potenti tra gli ultimi cellulari Apple. Apple ha lasciato intendere che la funzione potrebbe essere disponibile anche per i modelli precedenti. Google Lens è in circolazione dal 2017, quando il Pixel 2 era il telefono cellulare più popolare sul mercato.

Come per tutte le funzioni di Apple Intelligence, anche qui esiste una lista d'attesa. Per essere aggiunti alla lista, andate nelle impostazioni e cercate "Apple Intelligence & Siri". Quindi fare clic su "Aggiungi alla lista d'attesa". Non appena sarete in lista, potrete utilizzare il software.

Come si utilizza Visual Intelligence?

Attualmente, l'unico modo per avviare Visual Intelligence è tenere premuto il pulsante di controllo della fotocamera. Si tratta della nuova interfaccia di controllo in basso a destra del telefono. Non appena viene premuto, si apre l'interfaccia di Visual Intelligence.

Ora inizia il divertimento. È sufficiente puntare il telefono verso qualcosa e selezionare ChatGPT utilizzando l'icona in basso a sinistra o Google Image Search utilizzando l'icona in basso a destra. In alternativa, se il campo visivo contiene del testo, toccare il cerchio nella parte inferiore dello schermo. È anche possibile puntare il telefono verso un'attività commerciale per ottenere informazioni utili.

Come interagire con il testo

Tenere il telefono davanti al testo, attivare Visual Intelligence e toccare il cerchio nella parte inferiore dello schermo. In questo modo il testo viene analizzato. Una volta analizzato il testo, sono disponibili diverse opzioni. Toccare "Traduci" nella parte inferiore dello schermo per tradurre il testo in un'altra lingua. Toccare "Leggi ad alta voce" per far leggere a Siri il testo ad alta voce. Toccare "Riepilogo" per ricevere un breve riassunto del testo.

Lo strumento riconosce anche le informazioni di contatto presenti nel testo, come numeri di telefono, indirizzi e-mail e siti web. L'utente può eseguire diverse azioni a seconda del tipo di testo. Ad esempio, il numero di telefono può essere toccato per effettuare una chiamata. Altre azioni includono l'invio di un'e-mail, la creazione di un appuntamento o la consultazione di un sito web. Toccare il pulsante "Altro" per visualizzare tutte le opzioni disponibili. Toccare "Chiudi" o scorrere il dito verso l'alto per terminare la sessione.

Interagire con un'azienda

Con Visual Intelligence è possibile richiamare i dettagli di un'azienda che si trova proprio di fronte a noi. È sufficiente aprire lo strumento e puntare la telecamera sull'insegna. Il nome dell'azienda dovrebbe apparire nella parte superiore dello schermo. Toccare "Orari di apertura" per visualizzare gli orari di apertura o "Ordina" per acquistare qualcosa. Toccare "Menu" per vedere il menu o i servizi disponibili, oppure toccare "Prenotazione" per effettuare una prenotazione. Per chiamare l'azienda, leggere le recensioni o visitare il sito web, toccare "Altro".
Passare il dito verso l'alto o toccare "Chiudi" per terminare la sessione. Questa funzione è attualmente disponibile solo per i clienti degli Stati Uniti.

Cosa devo fare con ChatGPT?

Per prima cosa, puntare la fotocamera su un oggetto. Attivare Visual Intelligence e toccare l'icona ChatGPT nell'angolo inferiore sinistro dello schermo. Toccare il pulsante "Chiedi" per ottenere informazioni sull'oggetto. Noi l'abbiamo applicata a un flacone di crema per le mani, che ha identificato correttamente. Apparirà quindi una casella di testo per ulteriori domande. Gli utenti possono chiedere quello che vogliono, ma i risultati possono variare. Abbiamo chiesto a ChatGPT dove comprare la crema per le mani e quanto costa. Il compito è stato superato a pieni voti. Evviva lo shopping.

Toccare il pulsante "Chiudi" o scorrere il dito verso l'alto per rimuovere tutti i campi e uscire da Visual Intelligence.

Cosa devo fare con la Ricerca immagini di Google?

Quando si seleziona Google Image Search, viene visualizzata una finestra di dialogo di Safari con foto simili provenienti da Internet. Un buon caso d'uso è la ricerca di offerte. Abbiamo scattato una foto di un flacone di crema per le mani e i risultati di Safari offrivano molti prezzi diversi tra cui scegliere. Tuttavia, l'utente deve trovare l'offerta migliore e concludere l'acquisto.

Toccare il pulsante "Chiudi" per rimuovere i risultati e scorrere verso l'alto dalla parte inferiore dello schermo per uscire dallo strumento.

Lascia una risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *