في وقت سابق من هذا الأسبوع، أصدرت Google DeepMind Gemini Robotics-ER-1.6، وهو نموذج رؤية ولغة جديد لمساعدة الروبوتات على فهم البيئة المحيطة بها. ولإظهار قدراتها، نشرت شركة بوسطن ديناميكس - التي أبرمت اتفاقًا لاستخدام جيميني في روبوتاتها البشرية - مقطع فيديو لكلابها الآلية التي تستخدم النموذج لقراءة مقياس الحرارة أثناء تفتيش منشأة صناعية.

وعلى الرغم من العروض التوضيحية الجذابة، إلا أن نموذج الروبوتات الجديد من جوجل حقق مكاسب إضافية فقط مقارنة بالنماذج السابقة من حيث قدرته على معرفة متى انتهت مهمة باستخدام تغذية كاميرا واحدة، وفقًا لمعايير جوجل. ولكن عند التقاط لقطات متعددة للكاميرا، أظهر النموذج تحسنًا. وتقول جوجل إن هذا أمر مهم، لأن العديد من إعدادات الروبوتات اليوم، مثل تلك الموجودة في المصانع أو المستودعات، تستخدم طرق عرض متعددة للكاميرا، مثل الكاميرا العلوية والكاميرا المثبتة على ذراع الروبوت. يجب أن يكون الروبوت قادرًا على استخدام كل هذه الكاميرات لتكوين فهم متماسك لما يفعله ومعرفة متى تكتمل المهمة.

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free