Mapema wiki hii, Google DeepMind ilitoa Gemini Robotics-ER-1.6, mtazamo mpya na muundo wa lugha ili kusaidia roboti kufahamu mazingira yao. Ili kuonyesha uwezo wake, Boston Dynamics—ambayo ina makubaliano ya kutumia Gemini katika roboti zake zenye umbo la kibinadamu—ilichapisha video ya mbwa wake wa roboti wakitumia modeli kusoma kipimajoto wakati wa ukaguzi wa kituo cha viwanda.
Licha ya onyesho la kuvutia macho, muundo mpya wa roboti wa Google ulipata faida ya ziada kuliko uwezo wake wa awali wa kulisha kulingana na kamera moja ya awali kulingana na uwezo wake wa kulisha kulingana na kamera ya awali. Vigezo vya Google. Lakini wakati wa kuchukua milisho ya kamera nyingi, mtindo ulionyesha uboreshaji. Hiyo ni muhimu, Google inasema, kwa sababu usanidi mwingi wa roboti leo, kama vile viwandani au ghala, hutumia maoni mengi ya kamera kama kamera ya juu na kamera iliyowekwa kwenye mkono wa roboti. Roboti lazima iweze kutumia kamera hizo zote ili kuunda uelewaji thabiti wa kile inachofanya na kujua kazi itakapokamilika.