Yn gynharach yr wythnos hon, rhyddhaodd Google DeepMind Gemini Robotics-ER-1.6, model gweledigaeth ac iaith newydd i helpu robotiaid i wneud synnwyr o'u hamgylchedd. Er mwyn dangos ei alluoedd, cyhoeddodd Boston Dynamics - sydd â chytundeb i ddefnyddio Gemini yn ei robotiaid humanoid - fideo o'i gŵn robot yn defnyddio'r model i ddarllen thermomedr yn ystod archwiliad o gyfleuster diwydiannol.
Er gwaethaf y demos trawiadol, dim ond enillion cynyddrannol a wnaeth model roboteg newydd Google o'i gymharu â modelau blaenorol o ran ei allu i ddweud pan oedd wedi gorffen tasg Google, yn ôl meincnod, gan ddefnyddio meincnod unigol. Ond wrth gymryd sawl porthiant camera i mewn, dangosodd y model welliant. Mae hynny'n bwysig, meddai Google, oherwydd bod llawer o setiau roboteg heddiw, fel y rhai mewn ffatrïoedd neu warysau, yn defnyddio golygfeydd camera lluosog fel camera uwchben a chamera wedi'i osod ar fraich y robot. Rhaid i'r robot allu defnyddio'r holl gamerâu hynny i greu dealltwriaeth gydlynol o'r hyn y mae'n ei wneud a gwybod pan fydd y dasg wedi'i chwblhau.