По-рано тази седмица Google DeepMind пусна Gemini Robotics-ER-1.6, нова визия и езиков модел, който помага на роботите да осмислят заобикалящата ги среда. За да покаже възможностите си, Boston Dynamics, която има споразумение да използва Gemini в своите хуманоидни роботи, публикува видеоклип на своите кучета роботи, използващи модела, за да отчитат термометър по време на инспекция на промишлено съоръжение.
Въпреки привличащите окото демонстрации, новият модел на роботиката на Google отбеляза само постепенни печалби спрямо предишните модели по отношение на способността си да разбере кога е завършил задача, използвайки емисия от една камера, според бенчмарковете на Google. Но при заснемане на множество канали от камерата моделът показа подобрение. Това е важно, казва Google, тъй като много роботизирани настройки днес, като тези във фабрики или складове, използват множество изгледи на камерата, като камера отгоре и камера, монтирана на ръката на робота. Роботът трябва да може да използва всички тези камери, за да създаде съгласувано разбиране за това, което прави, и да знае кога задачата е изпълнена.