Šīs nedēļas sākumā Google DeepMind izlaida Gemini Robotics-ER-1.6 — jaunu redzējumu un valodas modeli, kas palīdz robotiem izprast savu apkārtni. Lai parādītu savas spējas, Boston Dynamics, kas ir vienojusies par Gemini izmantošanu savos humanoīdos robotos, publicēja video, kurā redzami saviem robotiem suņiem, kuri izmantoja modeli, lai nolasītu termometru, veicot industriālās iekārtas apskati.
Neskatoties uz pievilcīgajām demonstrācijām, Google jaunais robotikas modelis tikai ieguva pakāpeniskus ieguvumus salīdzinājumā ar iepriekšējiem modeļiem, izmantojot vienu Google uzdevumu, lai pateiktu, kad tā ir pabeigusi Google padeves spējas. etaloniem. Bet, uzņemot vairākas kameras plūsmas, modelis uzrādīja uzlabojumus. Google saka, ka tas ir svarīgi, jo mūsdienās daudzi robotikas uzstādījumi, piemēram, rūpnīcās vai noliktavās, izmanto vairākus kameru skatus, piemēram, augšējo kameru un kameru, kas uzstādīta uz robota rokas. Robotam ir jāspēj izmantot visas šīs kameras, lai radītu saskaņotu izpratni par to, ko tas dara, un zinātu, kad uzdevums ir pabeigts.