На почетокот на оваа недела, Google DeepMind го објави Gemini Robotics-ER-1.6, нов модел на визија и јазик за да им помогне на роботите да ја разберат својата околина. За да ги покаже своите способности, Boston Dynamics - која има договор да користи Gemini во своите хуманоидни роботи - објави видео од своите кучиња роботи кои го користат моделот за да читаат термометар за време на инспекција на индустриски објект.
И покрај впечатливите демо снимки, новиот модел на роботика на Google покажа дека неговиот претходник модел се зголемил само во однос на неговиот завршен модел. задача со користење на еден довод на камерата, според одредниците на Google. Но, при внесување на повеќе доводи на камерата, моделот покажа подобрување. Тоа е важно, вели Google, бидејќи многу поставки за роботика денес, како што се оние во фабриките или магацините, користат повеќекратни прикази на камерата, како камера одозгора и камера поставена на раката на роботот. Роботот мора да може да ги користи сите тие камери за да создаде кохерентно разбирање за она што го прави и да знае кога задачата е завршена.