На початку цього тижня Google DeepMind випустив Gemini Robotics-ER-1.6, нову модель бачення та мови, яка допомагає роботам зрозуміти оточення. Щоб продемонструвати свої можливості, компанія Boston Dynamics, яка має угоду про використання Gemini у своїх роботах-гуманоїдах, опублікувала відео, на якому її роботи-собаки використовують модель для зчитування показань термометра під час інспекції промислового об’єкта.

Незважаючи на привабливі демонстрації, нова модель робототехніки Google лише значно покращилася порівняно з попередніми моделями щодо її здатності визначити, коли вона закінчила завдання за допомогою згідно з тестами Google. Але при прийомі кількох каналів камери модель показала покращення. Google каже, що це важливо, тому що багато сьогоднішніх робототехнічних установок, наприклад на заводах або складах, використовують кілька видів камери, як-от камера зверху та камера, встановлена ​​на руці робота. Робот повинен мати можливість використовувати всі ці камери, щоб чітко розуміти, що він робить, і знати, коли завдання виконано.

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free