Bu haftanın başlarında Google DeepMind, robotların çevrelerini anlamlandırmasına yardımcı olacak yeni bir vizyon ve dil modeli olan Gemini Robotics-ER-1.6'yı piyasaya sürdü. Gemini'yi insansı robotlarında kullanma anlaşması bulunan Boston Dynamics, yeteneklerini göstermek için, endüstriyel bir tesisin denetimi sırasında termometreyi okumak için modeli kullanan robot köpeklerinin bir videosunu yayınladı.
Göz alıcı demolara rağmen, Google'ın yeni robotik modeli, Google'ın karşılaştırmalarına göre, tek bir kamera yayını kullanarak bir görevi ne zaman bitirdiğini anlama yeteneği açısından önceki modellere göre yalnızca artan kazanımlar elde etti. Ancak birden fazla kamera yayınını alırken model bir gelişme gösterdi. Google bunun önemli olduğunu söylüyor, çünkü günümüzde fabrikalar veya depolar gibi birçok robotik kurulumu, üst kamera ve robotun koluna monte edilmiş bir kamera gibi birden fazla kamera görüntüsü kullanıyor. Robotun, ne yaptığına ilişkin tutarlı bir anlayış oluşturmak ve görevin ne zaman tamamlandığını bilmek için bu kameraların tümünü kullanabilmesi gerekir.