এই সপ্তাহের শুরুতে, Google DeepMind প্রকাশ করেছে Gemini Robotics-ER-1.6, একটি নতুন দৃষ্টি ও ভাষার মডেল যা রোবটকে তাদের পারিপার্শ্বিক অবস্থা বোঝাতে সাহায্য করে। এর ক্ষমতা প্রদর্শনের জন্য, Boston Dynamics-যার হিউম্যানয়েড রোবটে জেমিনি ব্যবহার করার চুক্তি রয়েছে—একটি শিল্প সুবিধা পরিদর্শনের সময় থার্মোমিটার পড়ার জন্য মডেলটি ব্যবহার করে তার রোবট কুকুরের একটি ভিডিও প্রকাশ করেছে।

চোখের মত ডেমো থাকা সত্ত্বেও, Google-এর নতুন রোবোটিক্স মডেলটি শুধুমাত্র পূর্ববর্তী মডেলের উচ্চতা অর্জনের ক্ষমতার উপর নির্ভর করে। গুগলের বেঞ্চমার্ক অনুসারে একটি একক ক্যামেরা ফিড ব্যবহার করে একটি কাজ শেষ করেছে। কিন্তু একাধিক ক্যামেরা ফিড নেওয়ার সময়, মডেলটি একটি উন্নতি দেখায়। এটি গুরুত্বপূর্ণ, গুগল বলে, কারণ আজ অনেক রোবোটিক্স সেটআপ, যেমন কারখানা বা গুদামগুলিতে, একাধিক ক্যামেরা ভিউ ব্যবহার করে যেমন একটি ওভারহেড ক্যামেরা এবং রোবটের বাহুতে লাগানো একটি ক্যামেরা। রোবটটি অবশ্যই এই সমস্ত ক্যামেরা ব্যবহার করতে সক্ষম হবে যাতে এটি কী করছে এবং কখন কাজটি সম্পূর্ণ হবে তা একটি সুসংগত বোঝাপড়া তৈরি করতে পারে৷

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free