Selle nädala alguses andis Google DeepMind välja Gemini Robotics-ER-1.6, uue visiooni- ja keelemudeli, mis aitab robotitel ümbritsevat mõtestada. Oma võimete demonstreerimiseks avaldas Boston Dynamics, kellel on leping Gemini kasutamiseks oma humanoidrobotites, video oma robotkoertest, kes kasutasid seda mudelit tööstusrajatise ülevaatuse ajal termomeetri lugemiseks.
Hoolimata pilkupüüdvatest demodest, saavutas Google'i uus robootikamudel eelnevate mudelitega võrreldes ainult järkjärgulise kasu, kasutades Google'i lõpetatud kaamera võimekust, et öelda, millal see oli valmis. võrdlusalused. Kuid mitme kaameravoo sissevõtmisel näitas mudel paranemist. Google ütleb, et see on oluline, sest paljud tänapäeval, näiteks tehastes või ladudes kasutatavad robootika seadistused, kasutavad mitut kaameravaadet, näiteks õhukaamerat ja roboti käele paigaldatud kaamerat. Robot peab suutma kasutada kõiki neid kaameraid, et luua ühtne arusaam oma tegemistest ja teada, millal ülesanne on lõpetatud.