ამ კვირის დასაწყისში Google DeepMind-მა გამოუშვა Gemini Robotics-ER-1.6, ახალი ხედვისა და ენის მოდელი, რომელიც ეხმარება რობოტებს გააცნობიერონ თავიანთი გარემო. თავისი შესაძლებლობების საჩვენებლად, Boston Dynamics-მა, რომელსაც აქვს შეთანხმება გამოიყენოს Gemini თავის ჰუმანოიდ რობოტებში, გამოაქვეყნა ვიდეო, სადაც რობოტი ძაღლები იყენებენ მოდელს თერმომეტრის წასაკითხად სამრეწველო ობიექტის შემოწმების დროს.
მიუხედავად თვალშისაცემი დემოს, Google-ის ახალ რობოტულ მოდელს ჰქონდა მხოლოდ მაშინ, როდესაც აჩვენა მისი წინა მოდელის შესაძლებლობების გაზრდის ტერმინები. დავალება ერთი კამერის არხის გამოყენებით, Google-ის კრიტერიუმების მიხედვით. მაგრამ კამერის მრავალი წყაროს მიღებისას მოდელმა აჩვენა გაუმჯობესება. Google-ის თქმით, ეს მნიშვნელოვანია, რადგან დღეს რობოტების მრავალი დაყენება, როგორიცაა ქარხნებში ან საწყობებში, იყენებს კამერის მრავალ ხედს, როგორიცაა ზედა კამერა და რობოტის მკლავზე დამონტაჟებული კამერა. რობოტს უნდა შეეძლოს გამოიყენოს ყველა ეს კამერა, რათა შექმნას თანმიმდევრული გაგება იმის შესახებ, თუ რას აკეთებს და იცოდეს, როდის დასრულდება დავალება.