Korume ĉi-semajne, Google DeepMind publikigis Gemini Robotics-ER-1.6, novan vizion kaj lingvomodelon por helpi robotojn kompreni sian ĉirkaŭaĵon. Por montri siajn kapablojn, Boston Dynamics—kiu havas interkonsenton por uzi Gemini en siaj humanoidaj robotoj—publikigis vidbendon de siaj robothundoj uzantaj la modelon por legi termometron dum inspektado de industria instalaĵo.
Malgraŭ la okulfrapaj demonstraĵoj, la nova robotikomodelo de Google nur atingis pliigajn gajnojn super antaŭaj modeloj rilate al sia kapablo de Google, kiam ĝi finis sian kapablon per nutrado, kiam ĝi finis sian kapablon per nutrado de Google. benchmarks. Sed prenante plurajn fotilojn, la modelo montris plibonigon. Tio estas grava, diras Google, ĉar multaj robotaj aranĝoj hodiaŭ, kiel tiuj en fabrikoj aŭ magazenoj, uzas plurajn fotilajn vidojn kiel supra fotilo kaj fotilo muntita sur la brako de la roboto. La roboto devas povi uzi ĉiujn tiujn fotilojn por krei koheran komprenon pri tio, kion ĝi faras kaj scii kiam la tasko estas kompleta.