Νωρίτερα αυτή την εβδομάδα, το Google DeepMind κυκλοφόρησε το Gemini Robotics-ER-1.6, ένα νέο μοντέλο οράματος και γλώσσας για να βοηθήσει τα ρομπότ να κατανοήσουν το περιβάλλον τους. Για να επιδείξει τις δυνατότητές της, η Boston Dynamics —η οποία έχει συμφωνήσει να χρησιμοποιεί το Gemini στα ανθρωποειδή ρομπότ της— δημοσίευσε ένα βίντεο με τα σκυλιά ρομπότ της που χρησιμοποιούν το μοντέλο για να διαβάσουν ένα θερμόμετρο κατά τη διάρκεια επιθεώρησης μιας βιομηχανικής εγκατάστασης.
Παρά τις εντυπωσιακές επιδείξεις, το νέο μοντέλο ρομποτικής της Google σημείωσε ότι τα προηγούμενα μοντέλα της σημείωσαν αύξηση της ικανότητάς του. εργασία χρησιμοποιώντας μία μόνο τροφοδοσία κάμερας, σύμφωνα με τα σημεία αναφοράς της Google. Αλλά κατά τη λήψη πολλαπλών τροφοδοτήσεων κάμερας, το μοντέλο έδειξε βελτίωση. Αυτό είναι σημαντικό, λέει η Google, επειδή πολλές εγκαταστάσεις ρομποτικής σήμερα, όπως αυτές σε εργοστάσια ή αποθήκες, χρησιμοποιούν πολλαπλές προβολές κάμερας, όπως μια κάμερα πάνω από το κεφάλι και μια κάμερα τοποθετημένη στο μπράτσο του ρομπότ. Το ρομπότ πρέπει να μπορεί να χρησιμοποιεί όλες αυτές τις κάμερες για να δημιουργήσει μια συνεκτική κατανόηση του τι κάνει και να γνωρίζει πότε η εργασία έχει ολοκληρωθεί.