Ranije ovog tjedna Google DeepMind objavio je Gemini Robotics-ER-1.6, novu viziju i jezični model koji pomaže robotima da shvate svoje okruženje. Kako bi pokazao svoje sposobnosti, Boston Dynamics—koji ima ugovor o korištenju Geminija u svojim humanoidnim robotima—objavio je video svojih pasa robota koji koriste model za očitavanje termometra tijekom inspekcije industrijskog pogona.
Unatoč privlačnim demonstracijama, Googleov novi model robotike samo je zabilježio inkrementalne dobitke u odnosu na prethodne modele u smislu svoje sposobnosti da kaže kada je završio zadatak pomoću jedan feed kamere, prema Googleovim mjerilima. Ali pri snimanju više feedova kamere, model je pokazao poboljšanje. To je važno, kaže Google, jer mnoge današnje robotske postavke, poput onih u tvornicama ili skladištima, koriste više pogleda kamera poput kamere iznad glave i kamere postavljene na ruku robota. Robot mora moći koristiti sve te kamere kako bi stvorio koherentno razumijevanje onoga što radi i znao kada je zadatak dovršen.