Google DeepMind julkaisi aiemmin tällä viikolla Gemini Robotics-ER-1.6:n, uuden visio- ja kielimallin, joka auttaa robotteja ymmärtämään ympäristöään. Osoittaakseen kykyjään Boston Dynamics – jolla on sopimus Geminin käyttämisestä humanoidiroboteissaan – julkaisi videon robottikoiristaan, jotka käyttivät mallia lukemaan lämpömittaria teollisuuslaitoksen tarkastuksen aikana.
Huolimatta silmäänpistävästä esittelystä Googlen uusi robotiikkamalli saavutti vain lisähyötyjä aiempiin kameramalleihin verrattuna. vertailuarvot. Mutta kun otettiin useita kamerasyötteitä, malli osoitti parannusta. Tämä on tärkeää, Google sanoo, koska monet nykypäivän robotiikkaasennukset, kuten tehtaissa tai varastoissa, käyttävät useita kameranäkymiä, kuten yläkameraa ja robotin käsivarteen asennettua kameraa. Robotin on kyettävä käyttämään kaikkia näitä kameroita luodakseen johdonmukaisen käsityksen siitä, mitä se tekee, ja tietää, milloin tehtävä on valmis.