מוקדם יותר השבוע, Google DeepMind פרסמה את Gemini Robotics-ER-1.6, מודל חזון ושפה חדש שיעזור לרובוטים להבין את הסביבה שלהם. כדי להראות את היכולות שלה, בוסטון דינמיקס - שיש לה הסכם להשתמש ב-Gemini ברובוטים דמויי אדם שלה - פרסמה סרטון של כלבי הרובוט שלה המשתמשים במודל לקריאת מדחום במהלך בדיקה של מתקן תעשייתי.
למרות ההדגמות המושכות את העין, מודל הרובוטיקה החדש של גוגל רשם רק הישגים מצטברים על המצלמה הקודמת שלו במונחים של עדכון על מודלים קודמים שלו. למדדים של גוגל. אך כאשר קלטו הזנות מרובות של מצלמה, הדגם הראה שיפור. זה חשוב, אומרת גוגל, מכיוון שהגדרות רובוטיקה רבות כיום, כמו אלו במפעלים או במחסנים, משתמשות במספר תצוגות מצלמה כמו מצלמה עילית ומצלמה המותקנת על זרועו של הרובוט. הרובוט חייב להיות מסוגל להשתמש בכל המצלמות הללו כדי ליצור הבנה קוהרנטית של מה שהוא עושה ולדעת מתי המשימה הושלמה.