در اوایل این هفته، Google DeepMind Gemini Robotics-ER-1.6 را منتشر کرد، یک مدل بینش و زبان جدید برای کمک به روباتها برای درک محیط اطرافشان. Boston Dynamics - که قرارداد استفاده از Gemini در رباتهای انساننما خود را دارد - برای نشان دادن تواناییهای خود، ویدیویی از سگهای ربات خود منتشر کرد که از این مدل برای خواندن دماسنج در حین بازرسی از یک مرکز صنعتی استفاده میکنند.
علیرغم نمایشهای نمایشی چشمنواز، مدل رباتیک جدید Google تنها زمانی که قابلیتهای مدل قبلی خود را افزایش میدهد، نشان میدهد که مدلهای قبلی خود را افزایش داده است. مطابق با معیارهای گوگل، با استفاده از یک فید دوربین تک کار کنید. اما هنگام دریافت چندین فید دوربین، مدل پیشرفت نشان داد. گوگل میگوید این مهم است، زیرا امروزه بسیاری از راهاندازیهای رباتیک، مانند آنهایی که در کارخانهها یا انبارها هستند، از چندین نمای دوربین مانند دوربین بالای سر و دوربین نصب شده روی بازوی ربات استفاده میکنند. ربات باید بتواند از همه آن دوربین ها استفاده کند تا درک منسجمی از کاری که انجام می دهد ایجاد کند و بداند چه زمانی کار کامل شده است.