Google entwickelt angeblich KI „Jarvis“, die Ihren Webbrowser übernehmen könnte

Google steht möglicherweise kurz davor, einen KI-Agenten auf den Markt zu bringen, der in der Lage ist, einen Webbrowser zu steuern, um Nutzern bei der Automatisierung alltäglicher Aufgaben zu helfen. The Information berichtet, dass das Unternehmen unter dem Codenamen Project Jarvis an einem „Computerusing Agent“ arbeitet, der bereits im Dezember vorgestellt werden könnte. Quellen, die mit The Information gesprochen haben, berichten, dass Jarvis auf die Befehle einer Person reagiert, indem er häufig Screenshots von dem macht, was auf dem Computerbildschirm zu sehen ist, und diese Aufnahmen interpretiert, bevor er Aktionen wie das Klicken auf eine Schaltfläche oder das Tippen in ein Textfeld ausführt.

Jarvis soll Berichten zufolge nur mit Webbrowsern – insbesondere Chrome – zusammenarbeiten, um bei allgemeinen Aufgaben wie Suchen, Einkaufen und Flugbuchungen zu helfen. Dies geschieht vor dem Hintergrund, dass Google die Fähigkeiten seiner KI Gemini erweitert, deren nächste Generation im Dezember vorgestellt werden soll, wie The Verge berichtet. Gemini Live, Googles KI-Chatbot, wurde diesen Monat um Dutzende neuer Sprachen erweitert, und die Gemini-Integration wurde kürzlich in Google Meet, Photos und andere Anwendungen integriert.

Die Ankündigung von Jarvis kommt nur wenige Tage, nachdem Anthropic eine ähnliche, aber offenbar umfassendere Funktion für seine KI Claude vorgestellt hat, die nach eigenen Angaben mit Computerkenntnissen ausgestattet wurde, die es ihr ermöglichen, „eine Vielzahl von Standardwerkzeugen und Softwareprogrammen zu nutzen, die für Menschen entwickelt wurden“. Diese Funktion ist nun in einer öffentlichen Beta-Version verfügbar.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert