ਇਸ ਹਫ਼ਤੇ ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ, Google DeepMind ਨੇ Gemini Robotics-ER-1.6 ਜਾਰੀ ਕੀਤਾ, ਰੋਬੋਟਾਂ ਨੂੰ ਉਹਨਾਂ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਦੀ ਸਮਝ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ ਇੱਕ ਨਵਾਂ ਦ੍ਰਿਸ਼ਟੀ ਅਤੇ ਭਾਸ਼ਾ ਮਾਡਲ। ਆਪਣੀਆਂ ਕਾਬਲੀਅਤਾਂ ਨੂੰ ਦਿਖਾਉਣ ਲਈ, ਬੋਸਟਨ ਡਾਇਨਾਮਿਕਸ—ਜਿਸ ਨੇ ਆਪਣੇ ਹਿਊਮਨਾਈਡ ਰੋਬੋਟਾਂ ਵਿੱਚ ਜੇਮਿਨੀ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦਾ ਸਮਝੌਤਾ ਕੀਤਾ ਹੈ—ਨੇ ਇੱਕ ਉਦਯੋਗਿਕ ਸਹੂਲਤ ਦੇ ਨਿਰੀਖਣ ਦੌਰਾਨ ਥਰਮਾਮੀਟਰ ਨੂੰ ਪੜ੍ਹਨ ਲਈ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਆਪਣੇ ਰੋਬੋਟ ਕੁੱਤਿਆਂ ਦਾ ਇੱਕ ਵੀਡੀਓ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ।
ਅੱਖਾਂ ਨੂੰ ਖਿੱਚਣ ਵਾਲੇ ਡੈਮੋ ਦੇ ਬਾਵਜੂਦ, ਗੂਗਲ ਦੇ ਨਵੇਂ ਰੋਬੋਟਿਕਸ ਮਾਡਲ ਨੇ ਪਿਛਲੇ ਮਾਡਲ ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਆਪਣੇ ਪੁਰਾਣੇ ਮਾਡਲਾਂ ਦੀ ਉੱਚਤਾ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਯੋਗਤਾ ਨੂੰ ਦਰਸਾਇਆ ਹੈ। ਗੂਗਲ ਦੇ ਬੈਂਚਮਾਰਕ ਦੇ ਅਨੁਸਾਰ, ਇੱਕ ਸਿੰਗਲ ਕੈਮਰਾ ਫੀਡ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਕੰਮ ਪੂਰਾ ਕਰ ਲਿਆ ਸੀ। ਪਰ ਜਦੋਂ ਮਲਟੀਪਲ ਕੈਮਰਾ ਫੀਡਸ ਨੂੰ ਲੈ ਕੇ, ਮਾਡਲ ਨੇ ਇੱਕ ਸੁਧਾਰ ਦਿਖਾਇਆ. ਇਹ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਗੂਗਲ ਕਹਿੰਦਾ ਹੈ, ਕਿਉਂਕਿ ਅੱਜ ਬਹੁਤ ਸਾਰੇ ਰੋਬੋਟਿਕ ਸੈਟਅਪ, ਜਿਵੇਂ ਕਿ ਫੈਕਟਰੀਆਂ ਜਾਂ ਵੇਅਰਹਾਊਸਾਂ ਵਿੱਚ, ਇੱਕ ਓਵਰਹੈੱਡ ਕੈਮਰਾ ਅਤੇ ਰੋਬੋਟ ਦੀ ਬਾਂਹ 'ਤੇ ਮਾਊਂਟ ਕੀਤੇ ਕੈਮਰੇ ਵਰਗੇ ਮਲਟੀਪਲ ਕੈਮਰਾ ਦ੍ਰਿਸ਼ਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਰੋਬੋਟ ਨੂੰ ਉਹਨਾਂ ਸਾਰੇ ਕੈਮਰਿਆਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੇ ਯੋਗ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ਤਾਂ ਕਿ ਉਹ ਕੀ ਕਰ ਰਿਹਾ ਹੈ ਅਤੇ ਇਹ ਜਾਣਨ ਲਈ ਕਿ ਇਹ ਕੀ ਕਰ ਰਿਹਾ ਹੈ।