در اوایل این هفته، Google DeepMind Gemini Robotics-ER-1.6 را منتشر کرد، یک مدل بینش و زبان جدید برای کمک به روبات‌ها برای درک محیط اطرافشان. Boston Dynamics - که قرارداد استفاده از Gemini در ربات‌های انسان‌نما خود را دارد - برای نشان دادن توانایی‌های خود، ویدیویی از سگ‌های ربات خود منتشر کرد که از این مدل برای خواندن دماسنج در حین بازرسی از یک مرکز صنعتی استفاده می‌کنند.

علی‌رغم نمایش‌های نمایشی چشم‌نواز، مدل رباتیک جدید Google تنها زمانی که قابلیت‌های مدل قبلی خود را افزایش می‌دهد، نشان می‌دهد که مدل‌های قبلی خود را افزایش داده است. مطابق با معیارهای گوگل، با استفاده از یک فید دوربین تک کار کنید. اما هنگام دریافت چندین فید دوربین، مدل پیشرفت نشان داد. گوگل می‌گوید این مهم است، زیرا امروزه بسیاری از راه‌اندازی‌های رباتیک، مانند آن‌هایی که در کارخانه‌ها یا انبارها هستند، از چندین نمای دوربین مانند دوربین بالای سر و دوربین نصب شده روی بازوی ربات استفاده می‌کنند. ربات باید بتواند از همه آن دوربین ها استفاده کند تا درک منسجمی از کاری که انجام می دهد ایجاد کند و بداند چه زمانی کار کامل شده است.

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free