Začátkem tohoto týdne vydala společnost Google DeepMind Gemini Robotics-ER-1.6, nový vize a jazykový model, který má robotům pomoci porozumět svému okolí. Aby předvedla své schopnosti, společnost Boston Dynamics – která má dohodu o používání Gemini ve svých humanoidních robotech – zveřejnila video svých robotických psů, kteří používají model ke čtení teploměru během inspekce průmyslového zařízení.

Navzdory poutavým ukázkám zaznamenal nový robotický model Google oproti předchozím modelům pouze inkrementální zisky, pokud jde o schopnost sdělit úkol pomocí jediné kamery, kdy byl dokončen, Google. Ale při vícenásobném záběru z kamery model vykazoval zlepšení. To je důležité, říká Google, protože mnoho dnešních robotických nastavení, jako jsou ty v továrnách nebo skladech, používá více kamerových pohledů, jako je horní kamera a kamera namontovaná na rameni robota. Robot musí být schopen používat všechny tyto kamery k vytvoření uceleného porozumění tomu, co dělá, a vědět, kdy je úkol dokončen.

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free