A Google DeepMind a hét elején kiadta a Gemini Robotics-ER-1.6-ot, egy új vízió- és nyelvi modellt, amely segít a robotoknak megérteni környezetüket. Képességeinek bemutatása érdekében a Boston Dynamics – amely megállapodást kötött a Gemini humanoid robotjaiban való használatára vonatkozó megállapodással – közzétett egy videót robotkutyáiról, amelyek a modell segítségével hőmérőt olvasnak le egy ipari létesítmény átvizsgálása során.

A szemet gyönyörködtető bemutatók ellenére a Google új robotikai modellje csak fokozatos javulást ért el az előző modellekhez képest. benchmarkok. De több kamera feed felvételekor a modell javulást mutatott. A Google szerint ez azért fontos, mert manapság sok robotikai beállítás, például a gyárakban vagy raktárakban, több kameranézetet használ, például egy felső kamerát és egy, a robot karjára szerelt kamerát. A robotnak képesnek kell lennie arra, hogy az összes kamerát használni tudja, hogy koherens képet adjon arról, hogy mit csinál, és tudja, mikor fejeződött be a feladat.

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free