Visual Intelligence – Apples Antwort auf Google Lens

Das kürzlich veröffentlichte iOS 18.2 bringt endlich viele der versprochenen Apple Intelligence-Funktionen wie Genmoji und Image Playground. Eines dieser lang erwarteten Tools ist Visual Intelligence, eine Funktion, die derzeit dem iPhone 16 Pro und Pro Max vorbehalten ist und erstmals auf dem Apple-Event im September vorgestellt wurde.

Was ist Visual Intelligence?

Visual Intelligence ist die Antwort von Apple auf Google Lens. Es nutzt das Kamerasystem und künstliche Intelligenz, um Bilder in Echtzeit zu analysieren und nützliche Informationen bereitzustellen. Dies kann den Menschen helfen, mehr über die Welt um sie herum zu erfahren, und ist besonders nützlich beim Einkaufen, beim Nachschlagen von Details über ein Restaurant oder ein Unternehmen, beim Übersetzen geschriebener Texte, beim Zusammenfassen von Texten oder beim Vorlesen von Texten. Es kann auch in die Google Bildersuche und ChatGPT integriert werden.

Gibt es Einschränkungen?

Es gibt zwei Einschränkungen. Die Einführung von Apple Intelligence war ein ziemliches Durcheinander, und dieser Trend setzt sich mit Visual Intelligence fort. Im Moment funktionieren die Tools nur mit dem iPhone 16 Pro und Pro Max, den leistungsstärksten der neuesten Mobiltelefone von Apple. Apple hat angedeutet, dass die Funktion möglicherweise auch für ältere Modelle verfügbar sein wird. Google Lens gibt es seit 2017, als das Pixel 2 das angesagteste Handy auf dem Markt war.

Wie bei allen Funktionen von Apple Intelligence gibt es auch hier eine Warteliste. Um sich auf die Liste setzen zu lassen, gehen Sie zu den Einstellungen und suchen Sie nach „Apple Intelligence & Siri“. Klicken Sie dann auf „Zur Warteliste hinzufügen“. Sobald Sie auf der Liste stehen, können Sie die Software verwenden.

Wie benutze ich Visual Intelligence?

Die einzige Möglichkeit, Visual Intelligence zu starten, ist derzeit ein langer Druck auf die Kamerasteuerungstaste. Dabei handelt es sich um die neue Steuerungsschnittstelle auf der unteren rechten Seite des Handgeräts. Sobald sie gedrückt wird, öffnet sich die Visual Intelligence Oberfläche.

Jetzt beginnt der Spaß. Richten Sie Ihr Telefon einfach auf etwas und wählen Sie ChatGPT über das Symbol unten links oder Google Bildersuche über das Symbol unten rechts. Wenn das Sichtfeld Text enthält, tippen Sie alternativ auf den Kreis am unteren Bildschirmrand. Sie können Ihr Telefon auch auf ein Unternehmen richten, um nützliche Informationen zu erhalten.

So interagieren Sie mit Text

Halten Sie das Telefon vor den Text, aktivieren Sie Visual Intelligence und tippen Sie auf den Kreis am unteren Bildschirmrand. Dadurch wird der Text analysiert. Nach der Analyse stehen Ihnen mehrere Optionen zur Verfügung. Tippen Sie auf „Übersetzen“ am unteren Bildschirmrand, um den Text in eine andere Sprache zu übersetzen. Tippen Sie auf „Vorlesen“, um den Text von Siri vorlesen zu lassen. Tippen Sie auf „Zusammenfassung“, um eine kurze Zusammenfassung des Textes zu erhalten.

Das Tool erkennt auch Kontaktinformationen im Text wie Telefonnummern, E-Mail-Adressen und Websites. Der Benutzer kann je nach Art des Textes verschiedene Aktionen ausführen. Beispielsweise kann die Telefonnummer angetippt werden, um anzurufen. Andere Aktionen sind das Senden einer E-Mail, das Erstellen eines Termins oder das Aufrufen einer Website. Tippen Sie auf die Schaltfläche „Mehr“, um alle verfügbaren Optionen anzuzeigen. Tippen Sie auf „Schließen“ oder streichen Sie mit dem Finger nach oben, um die Sitzung zu beenden.

Mit einem Unternehmen interagieren

Mit Visual Intelligence können Sie Details über ein Unternehmen abrufen, das sich direkt vor Ihnen befindet. Öffnen Sie einfach das Tool und richten Sie die Kamera auf das Schild. Der Name des Unternehmens sollte oben auf dem Bildschirm erscheinen. Tippen Sie auf „Öffnungszeiten“, um die Öffnungszeiten zu sehen, oder auf „Bestellen“, um etwas zu kaufen. Tippen Sie auf „Menü“, um die Speisekarte oder die verfügbaren Dienstleistungen anzuzeigen, oder auf „Reservierung“, um eine Reservierung vorzunehmen. Um das Unternehmen anzurufen, Bewertungen zu lesen oder die Website aufzurufen, tippen Sie auf „Mehr“.
Wischen Sie mit dem Finger nach oben oder tippen Sie auf „Schließen“, um die Sitzung zu beenden. Diese Funktion ist derzeit nur für Kunden in den USA verfügbar.

Was mache ich mit ChatGPT?

Zuerst die Kamera auf ein Objekt richten. Aktivieren Sie Visual Intelligence und tippen Sie auf das ChatGPT-Symbol in der linken unteren Ecke des Bildschirms. Tippen Sie auf die Schaltfläche „Fragen“, um Informationen über das Objekt zu erhalten. Wir haben es auf eine Flasche Handcreme angewendet, die es richtig identifiziert hat. Daraufhin erscheint ein Textfeld für weitere Fragen. Die Benutzer können fragen, was sie wollen, aber die Ergebnisse können variieren. Wir haben ChatGPT gefragt, wo man die Handcreme kaufen kann und wie viel sie kostet. Es hat diese Aufgabe mit Bravour gemeistert. Juhu, Einkaufen.

Tippen Sie auf die Schaltfläche „Schließen“ oder wischen Sie mit dem Finger nach oben, um alle Felder zu entfernen und Visual Intelligence zu beenden.

Was mache ich mit der Google Bildersuche?

Wenn Sie die Google Bildersuche auswählen, wird ein Safari-Dialogfeld mit ähnlichen Fotos aus dem Internet angezeigt. Ein guter Anwendungsfall ist das Finden von Angeboten. Wir haben ein Foto von einer Flasche Handcreme gemacht und die Safari-Ergebnisse haben viele verschiedene Preise zur Auswahl angeboten. Der Benutzer muss jedoch selbst das beste Angebot finden und den Kauf abschließen.

Tippen Sie auf die Schaltfläche „Schließen“, um die Ergebnisse zu entfernen, und wischen Sie dann vom unteren Bildschirmrand nach oben, um das Tool zu beenden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert