एजेंट एआई ग्राहक अनुभव और परिचालन दक्षता को बदलने के लिए तैयार है, जिसके लिए नेतृत्व से एक नए रणनीतिक दृष्टिकोण की आवश्यकता है। कृत्रिम बुद्धिमत्ता में यह विकास सिस्टम को सरल अनुशंसाओं से आगे बढ़कर सक्रिय कार्रवाई की ओर बढ़ते हुए, योजना बनाने, निष्पादित करने और कार्यों में बने रहने का अधिकार देता है। यूएक्स टीमों, उत्पाद प्रबंधकों और अधिकारियों के लिए, इस बदलाव को समझना नवाचार में अवसरों को अनलॉक करने, वर्कफ़्लो को सुव्यवस्थित करने और प्रौद्योगिकी लोगों की सेवा करने के तरीके को फिर से परिभाषित करने के लिए महत्वपूर्ण है। एजेंटिक एआई को रोबोटिक प्रोसेस ऑटोमेशन (आरपीए) के साथ भ्रमित करना आसान है, जो ऐसी तकनीक है जो कंप्यूटर पर किए गए नियम-आधारित कार्यों पर ध्यान केंद्रित करती है। अंतर कठोरता बनाम तर्क में निहित है। आरपीए एक सख्त स्क्रिप्ट का पालन करने में उत्कृष्ट है: यदि एक्स होता है, तो वाई करें। यह मानव हाथों की नकल करता है। एजेंट एआई मानवीय तर्क की नकल करता है। यह एक रेखीय लिपि का अनुसरण नहीं करता है; यह एक बनाता है. एक भर्ती कार्यप्रवाह पर विचार करें. एक आरपीए बॉट एक बायोडाटा को स्कैन कर सकता है और उसे डेटाबेस पर अपलोड कर सकता है। यह दोहराए जाने वाले कार्य को पूरी तरह से करता है। एक एजेंट सिस्टम बायोडाटा को देखता है, नोटिस करता है कि उम्मीदवार एक विशिष्ट प्रमाणीकरण सूचीबद्ध करता है, एक नए ग्राहक की आवश्यकता के साथ क्रॉस-रेफरेंस करता है, और उस मैच को उजागर करते हुए एक वैयक्तिकृत आउटरीच ईमेल का मसौदा तैयार करने का निर्णय लेता है। आरपीए एक पूर्वनिर्धारित योजना क्रियान्वित करता है; एजेंट एआई एक लक्ष्य के आधार पर योजना तैयार करता है। यह स्वायत्तता एजेंटों को उन पूर्वानुमान उपकरणों से अलग करती है जिनका उपयोग हमने पिछले दशक में किया है। एक अन्य उदाहरण बैठक विवादों का प्रबंधन करना है। आपके कैलेंडर में एकीकृत एक पूर्वानुमानित मॉडल आपके मीटिंग शेड्यूल और आपके सहकर्मियों के शेड्यूल का विश्लेषण कर सकता है। यह तब संभावित संघर्षों का सुझाव दे सकता है, जैसे कि एक ही समय में निर्धारित दो महत्वपूर्ण बैठकें, या एक बैठक निर्धारित जब कोई प्रमुख भागीदार छुट्टी पर हो। यह आपको जानकारी प्रदान करता है और संभावित मुद्दों को चिह्नित करता है, लेकिन कार्रवाई करने के लिए आप जिम्मेदार हैं। उसी परिदृश्य में, एक एजेंटिक एआई, केवल टकरावों से बचने का सुझाव देने से भी आगे निकल जाएगा। किसी प्रमुख भागीदार के साथ टकराव की पहचान होने पर, एजेंट निम्नलिखित कार्य कर सकता है:
सभी आवश्यक प्रतिभागियों की उपलब्धता की जाँच करना। वैकल्पिक समय स्लॉट की पहचान करना जो सभी के लिए काम करे। सभी उपस्थित लोगों को प्रस्तावित नई बैठक का निमंत्रण भेजा जा रहा है। यदि विवाद किसी बाहरी प्रतिभागी के साथ है, तो एजेंट पुनर्निर्धारण की आवश्यकता बताते हुए और वैकल्पिक समय की पेशकश करते हुए एक ईमेल का मसौदा तैयार कर सकता है और भेज सकता है। एक बार पुष्टि हो जाने पर नए मीटिंग विवरण के साथ अपने कैलेंडर और अपने सहकर्मियों के कैलेंडर को अपडेट करना।
यह एजेंट एआई लक्ष्य को समझता है (बैठक के संघर्ष को हल करना), चरणों की योजना बनाना (उपलब्धता की जांच करना, विकल्प ढूंढना, निमंत्रण भेजना), उन चरणों को निष्पादित करता है, और संघर्ष के हल होने तक जारी रहता है, यह सब न्यूनतम प्रत्यक्ष उपयोगकर्ता हस्तक्षेप के साथ होता है। यह "एजेंट" अंतर को प्रदर्शित करता है: सिस्टम उपयोगकर्ता को केवल जानकारी प्रदान करने के बजाय उपयोगकर्ता के लिए सक्रिय कदम उठाता है। एजेंट एआई सिस्टम एक लक्ष्य को समझते हैं, इसे प्राप्त करने के लिए चरणों की एक श्रृंखला की योजना बनाते हैं, उन चरणों को निष्पादित करते हैं, और यहां तक कि अगर चीजें गलत होती हैं तो अनुकूलन भी करते हैं। इसे एक सक्रिय डिजिटल सहायक की तरह समझें। अंतर्निहित तकनीक अक्सर समझ और तर्क के लिए बड़े भाषा मॉडल (एलएलएम) को योजना एल्गोरिदम के साथ जोड़ती है जो जटिल कार्यों को प्रबंधनीय कार्यों में तोड़ देती है। ये एजेंट अपने उद्देश्यों को पूरा करने के लिए विभिन्न उपकरणों, एपीआई और यहां तक कि अन्य एआई मॉडल के साथ बातचीत कर सकते हैं, और गंभीर रूप से, वे एक सतत स्थिति बनाए रख सकते हैं, जिसका अर्थ है कि वे पिछले कार्यों को याद रखते हैं और समय के साथ एक लक्ष्य की ओर काम करना जारी रखते हैं। यह उन्हें विशिष्ट जेनरेटिव एआई से मौलिक रूप से अलग बनाता है, जो आमतौर पर एक ही अनुरोध को पूरा करता है और फिर रीसेट करता है। एजेंटिक व्यवहार का एक सरल वर्गीकरण हम एजेंट के व्यवहार को स्वायत्तता के चार अलग-अलग तरीकों में वर्गीकृत कर सकते हैं। हालाँकि ये अक्सर प्रगति की तरह दिखते हैं, ये स्वतंत्र ऑपरेटिंग मोड के रूप में कार्य करते हैं। कोई उपयोगकर्ता शेड्यूलिंग के लिए स्वायत्त रूप से कार्य करने के लिए किसी एजेंट पर भरोसा कर सकता है, लेकिन वित्तीय लेनदेन के लिए इसे "सुझाव मोड" में रखें। हमने डिजिटल उपयोगकर्ता अनुभव संदर्भों के लिए स्वायत्त वाहनों (एसएई स्तरों) के लिए उद्योग मानकों को अपनाकर ये स्तर प्राप्त किए हैं। निरीक्षण करें और सुझाव दें एजेंट एक मॉनिटर के रूप में कार्य करता है। यह डेटा स्ट्रीम का विश्लेषण करता है और विसंगतियों या अवसरों को चिह्नित करता है, लेकिन कोई कार्रवाई नहीं करता है। भेदभाव, अगले स्तर के विपरीत, एजेंट कोई जटिल योजना नहीं बनाता है। यह एक समस्या की ओर इशारा करता है. उदाहरण: DevOps एजेंट सर्वर CPU स्पाइक को नोटिस करता है और ऑन-कॉल इंजीनियर को सचेत करता है। यह नहीं जानता कि इसे कैसे ठीक किया जाए या इसे ठीक करने का प्रयास कैसे किया जाए, लेकिन यह जानता है कि कुछ गड़बड़ है। इस स्तर पर डिज़ाइन और निरीक्षण के लिए निहितार्थ,डिज़ाइन और निरीक्षण में उपयोगकर्ताओं के लिए सुझावों पर कार्रवाई करने के लिए स्पष्ट, गैर-दखल देने वाली सूचनाओं और एक अच्छी तरह से परिभाषित प्रक्रिया को प्राथमिकता देनी चाहिए। नियंत्रण लिए बिना समय पर और प्रासंगिक जानकारी के साथ उपयोगकर्ता को सशक्त बनाने पर ध्यान केंद्रित किया गया है। यूएक्स चिकित्सकों को सुझावों को स्पष्ट और समझने में आसान बनाने पर ध्यान केंद्रित करना चाहिए, जबकि उत्पाद प्रबंधकों को यह सुनिश्चित करना होगा कि सिस्टम उपयोगकर्ता पर दबाव डाले बिना मूल्य प्रदान करे। योजना-और-प्रस्ताव एजेंट एक लक्ष्य की पहचान करता है और उसे प्राप्त करने के लिए एक बहु-चरणीय रणनीति तैयार करता है। यह मानव समीक्षा की पूरी योजना प्रस्तुत करता है। विभेदनएजेंट एक रणनीतिकार के रूप में कार्य करता है। यह क्रियान्वित नहीं होता; यह संपूर्ण दृष्टिकोण पर अनुमोदन की प्रतीक्षा करता है। उदाहरण वही DevOps एजेंट CPU स्पाइक को नोटिस करता है, लॉग का विश्लेषण करता है, और एक सुधारात्मक योजना प्रस्तावित करता है:
दो अतिरिक्त उदाहरण स्पिन करें. लोड बैलेंसर को पुनरारंभ करें. पुराने लॉग संग्रहित करें.
मानव तर्क की समीक्षा करता है और "योजना स्वीकृत करें" पर क्लिक करता है। डिज़ाइन और निरीक्षण के लिए निहितार्थ उन एजेंटों के लिए जो योजना बनाते हैं और प्रस्तावित करते हैं, डिज़ाइन को यह सुनिश्चित करना चाहिए कि प्रस्तावित योजनाएँ आसानी से समझ में आएँ और उपयोगकर्ताओं के पास उन्हें संशोधित करने या अस्वीकार करने के सहज तरीके हों। प्रस्तावों की गुणवत्ता और एजेंट के नियोजन तर्क की निगरानी में निरीक्षण महत्वपूर्ण है। यूएक्स चिकित्सकों को प्रस्तावित योजनाओं का स्पष्ट विज़ुअलाइज़ेशन डिज़ाइन करना चाहिए, और उत्पाद प्रबंधकों को स्पष्ट समीक्षा और अनुमोदन वर्कफ़्लो स्थापित करना चाहिए। पुष्टि के साथ कार्य करें एजेंट सभी तैयारी कार्य पूरा करता है और अंतिम कार्रवाई को चरणबद्ध स्थिति में रखता है। यह प्रभावी ढंग से दरवाजे को खुला रखता है और सिर हिलाने की प्रतीक्षा करता है। विभेदीकरण यह "योजना-और-प्रस्ताव" से भिन्न है क्योंकि कार्य पहले ही पूरा हो चुका है और चरणबद्ध है। यह घर्षण को कम करता है. उपयोगकर्ता परिणाम की पुष्टि करता है, रणनीति की नहीं। उदाहरण: एक भर्ती एजेंट पांच साक्षात्कार निमंत्रणों का मसौदा तैयार करता है, कैलेंडर पर खुले समय का पता लगाता है और कैलेंडर ईवेंट बनाता है। यह एक "सभी भेजें" बटन प्रस्तुत करता है। उपयोगकर्ता बाहरी कार्रवाई को ट्रिगर करने के लिए अंतिम प्राधिकरण प्रदान करता है। डिज़ाइन और निरीक्षण के लिए निहितार्थ जब एजेंट पुष्टि के साथ कार्य करते हैं, तो डिज़ाइन को संभावित परिणामों को स्पष्ट रूप से रेखांकित करते हुए, इच्छित कार्रवाई का पारदर्शी और संक्षिप्त सारांश प्रदान करना चाहिए। निरीक्षण को यह सत्यापित करने की आवश्यकता है कि पुष्टिकरण प्रक्रिया मजबूत है और उपयोगकर्ताओं को आँख बंद करके कार्रवाई को मंजूरी देने के लिए नहीं कहा जा रहा है। यूएक्स चिकित्सकों को ऐसे पुष्टिकरण संकेत तैयार करने चाहिए जो स्पष्ट हों और सभी आवश्यक जानकारी प्रदान करें, और उत्पाद प्रबंधकों को सभी पुष्टि की गई कार्रवाइयों के लिए एक मजबूत ऑडिट ट्रेल को प्राथमिकता देनी चाहिए। कार्य-स्वायत्ततापूर्वक एजेंट परिभाषित सीमाओं के भीतर स्वतंत्र रूप से कार्यों को निष्पादित करता है। विभेदन उपयोगकर्ता क्रियाओं के इतिहास की समीक्षा करता है, न कि स्वयं क्रियाओं की। उदाहरण: भर्ती करने वाला एजेंट किसी टकराव को देखता है, साक्षात्कार को बैकअप स्लॉट में ले जाता है, उम्मीदवार को अपडेट करता है, और भर्ती प्रबंधक को सूचित करता है। मानव केवल एक अधिसूचना देखता है: साक्षात्कार मंगलवार को पुनर्निर्धारित किया गया। डिज़ाइन और निरीक्षण के लिए निहितार्थ स्वायत्त एजेंटों के लिए, डिज़ाइन को स्पष्ट पूर्व-अनुमोदित सीमाएँ स्थापित करने और मजबूत निगरानी उपकरण प्रदान करने की आवश्यकता है। निरीक्षण के लिए इन सीमाओं के भीतर एजेंट के प्रदर्शन के निरंतर मूल्यांकन की आवश्यकता होती है, उपयोगकर्ता नियंत्रण और विश्वास बनाए रखने के लिए मजबूत लॉगिंग, स्पष्ट ओवरराइड तंत्र और उपयोगकर्ता-परिभाषित किल स्विच की महत्वपूर्ण आवश्यकता होती है। यूएक्स चिकित्सकों को स्वायत्त एजेंट व्यवहार की निगरानी के लिए प्रभावी डैशबोर्ड डिजाइन करने पर ध्यान केंद्रित करना चाहिए, और उत्पाद प्रबंधकों को यह सुनिश्चित करना चाहिए कि स्पष्ट शासन और नैतिक दिशानिर्देश लागू हों।
आइए इन तरीकों को क्रियान्वित करने के लिए मानव संसाधन प्रौद्योगिकी में वास्तविक दुनिया के अनुप्रयोग पर नजर डालें। नियुक्ति के लॉजिस्टिक्स को संभालने के लिए डिज़ाइन किए गए "साक्षात्कार समन्वय एजेंट" पर विचार करें।
सुझाव मोड में एजेंट को पता चलता है कि साक्षात्कारकर्ता डबल बुक हो गया है। यह भर्तीकर्ता के डैशबोर्ड पर संघर्ष पर प्रकाश डालता है: "चेतावनी: सारा को दोपहर 2 बजे के साक्षात्कार के लिए डबल बुक किया गया है।" योजना मोड में एजेंट सारा के कैलेंडर और उम्मीदवार की उपलब्धता का विश्लेषण करता है। यह एक समाधान प्रस्तुत करता है: "मैं साक्षात्कार को गुरुवार सुबह 10 बजे स्थानांतरित करने की सलाह देता हूं। इसके लिए सारा को उसके प्रबंधक के साथ 1:1 में स्थानांतरित करने की आवश्यकता है।" भर्तीकर्ता इस तर्क की समीक्षा करता है। पुष्टिकरण मोड में एजेंट उम्मीदवार और प्रबंधक को ईमेल ड्राफ्ट करता है। यह कैलेंडर आमंत्रणों को पॉप्युलेट करता है। भर्तीकर्ता एक सारांश देखता है: "गुरुवार को पुनर्निर्धारित करने के लिए तैयार। अपडेट भेजें?" भर्तीकर्ता "पुष्टि करें" पर क्लिक करता है। स्वायत्त मोड में एजेंट तुरंत संघर्ष को संभालता है। यह पूर्व-निर्धारित नियम का सम्मान करता है: "हमेशा उम्मीदवार के साक्षात्कार को आंतरिक 1:1 से अधिक प्राथमिकता दें।" यह मीटिंग को आगे बढ़ाता है और सूचनाएं भेजता है। भर्तीकर्ता को एक लॉग प्रविष्टि दिखाई देती है: “समाधान हो गयाउम्मीदवार बी के लिए शेड्यूल संघर्ष।"
रिसर्च प्राइमर: क्या शोध करें और कैसे प्रभावी एजेंटिक एआई विकसित करने के लिए पारंपरिक सॉफ्टवेयर या यहां तक कि जेनरेटिव एआई की तुलना में एक अलग शोध दृष्टिकोण की आवश्यकता होती है। एआई एजेंटों की स्वायत्त प्रकृति, निर्णय लेने की उनकी क्षमता और सक्रिय कार्रवाई की उनकी क्षमता के लिए उपयोगकर्ता की अपेक्षाओं को समझने, जटिल एजेंट व्यवहारों को मैप करने और संभावित विफलताओं की आशंका के लिए विशेष पद्धतियों की आवश्यकता होती है। निम्नलिखित शोध प्राइमर एजेंटिक एआई के इन अद्वितीय पहलुओं को मापने और मूल्यांकन करने के लिए प्रमुख तरीकों की रूपरेखा तैयार करता है। मानसिक-मॉडल साक्षात्कार ये साक्षात्कार उपयोगकर्ताओं की पूर्वकल्पित धारणाओं को उजागर करते हैं कि एक एआई एजेंट को कैसा व्यवहार करना चाहिए। केवल यह पूछने के बजाय कि उपयोगकर्ता क्या चाहते हैं, एजेंट की क्षमताओं और सीमाओं के उनके आंतरिक मॉडल को समझने पर ध्यान केंद्रित किया गया है। हमें प्रतिभागियों के साथ "एजेंट" शब्द का प्रयोग करने से बचना चाहिए। यह विज्ञान-कल्पना का सामान लेकर चलता है या यह एक ऐसा शब्द है जिसे समर्थन या सेवाएं प्रदान करने वाले मानव एजेंट के साथ आसानी से भ्रमित किया जा सकता है। इसके बजाय, चर्चा को "सहायकों" या "सिस्टम" के इर्द-गिर्द रखें। हमें यह पता लगाने की जरूरत है कि उपयोगकर्ता सहायक स्वचालन और घुसपैठ नियंत्रण के बीच कहां रेखा खींचते हैं।
विधि: उपयोगकर्ताओं को विभिन्न काल्पनिक परिदृश्यों में एजेंट के साथ उनकी अपेक्षित बातचीत का वर्णन करने, चित्रित करने या वर्णन करने के लिए कहें। मुख्य जांच (विभिन्न प्रकार के उद्योगों को दर्शाते हुए): वांछित स्वचालन की सीमाओं और अति-स्वचालन के आसपास संभावित चिंताओं को समझने के लिए, पूछें: यदि आपकी उड़ान रद्द हो जाती है, तो आप क्या चाहेंगे कि सिस्टम स्वचालित रूप से कार्य करे? यदि आपके स्पष्ट निर्देश के बिना उसने ऐसा किया तो आपको क्या चिंता होगी?
एजेंट की आंतरिक प्रक्रियाओं और आवश्यक संचार के बारे में उपयोगकर्ता की समझ का पता लगाने के लिए, पूछें: कल्पना कीजिए कि एक डिजिटल सहायक आपके स्मार्ट होम का प्रबंधन कर रहा है। यदि कोई पैकेज वितरित किया जाता है, तो आप क्या सोचते हैं कि इसमें क्या कदम उठाए जाएंगे, और आप क्या जानकारी प्राप्त करने की उम्मीद करेंगे?
एक बहु-चरणीय प्रक्रिया के अंतर्गत नियंत्रण और सहमति से संबंधित अपेक्षाओं को उजागर करने के लिए, पूछें: यदि आप अपने डिजिटल सहायक से मीटिंग शेड्यूल करने के लिए कहते हैं, तो आप क्या कदम उठाने की कल्पना करते हैं? आप किस बिंदु पर परामर्श लेना चाहेंगे या विकल्प देना चाहेंगे?
विधि के लाभ: अंतर्निहित धारणाओं को प्रकट करता है, उन क्षेत्रों पर प्रकाश डालता है जहां एजेंट का नियोजित व्यवहार उपयोगकर्ता की अपेक्षाओं से भिन्न हो सकता है, और उचित नियंत्रण और प्रतिक्रिया तंत्र के डिजाइन की जानकारी देता है।
एजेंट यात्रा मानचित्रण: पारंपरिक उपयोगकर्ता यात्रा मानचित्रण के समान, एजेंट यात्रा मानचित्रण विशेष रूप से उपयोगकर्ता की बातचीत के साथ-साथ एआई एजेंट के प्रत्याशित कार्यों और निर्णय बिंदुओं पर ध्यान केंद्रित करता है। इससे संभावित नुकसानों की सक्रिय रूप से पहचान करने में मदद मिलती है।
विधि: एक विज़ुअल मानचित्र बनाएं जो किसी एजेंट के संचालन के विभिन्न चरणों को रेखांकित करता है, शुरुआत से लेकर समापन तक, जिसमें सभी संभावित कार्य, निर्णय और बाहरी सिस्टम या उपयोगकर्ताओं के साथ बातचीत शामिल है। मानचित्र के मुख्य तत्व: एजेंट के कार्य: एजेंट कौन से विशिष्ट कार्य या निर्णय करता है? सूचना इनपुट/आउटपुट: एजेंट को किस डेटा की आवश्यकता है, और वह कौन सी जानकारी उत्पन्न या संचार करता है? निर्णय बिंदु: एजेंट कहां चुनाव करता है, और उन विकल्पों के लिए मानदंड क्या हैं? उपयोगकर्ता सहभागिता बिंदु: उपयोगकर्ता कहां इनपुट प्रदान करता है, समीक्षा करता है या कार्यों को मंजूरी देता है? विफलता के बिंदु: महत्वपूर्ण रूप से, उन विशिष्ट उदाहरणों की पहचान करें जहां एजेंट निर्देशों की गलत व्याख्या कर सकता है, गलत निर्णय ले सकता है, या गलत इकाई के साथ बातचीत कर सकता है। उदाहरण: गलत प्राप्तकर्ता (उदाहरण के लिए, गलत व्यक्ति को संवेदनशील जानकारी भेजना), ओवरड्राफ्ट (उदाहरण के लिए, उपलब्ध धनराशि से अधिक स्वचालित भुगतान), इरादे की गलत व्याख्या (उदाहरण के लिए, अस्पष्ट भाषा के कारण गलत तारीख के लिए उड़ान बुक करना)।
पुनर्प्राप्ति पथ: एजेंट या उपयोगकर्ता इन विफलताओं से कैसे उबर सकता है? सुधार या हस्तक्षेप के लिए क्या तंत्र मौजूद हैं?
विधि के लाभ: एजेंट के परिचालन प्रवाह का एक समग्र दृष्टिकोण प्रदान करता है, छिपी हुई निर्भरता को उजागर करता है, और नकारात्मक परिणामों को रोकने या कम करने के लिए सुरक्षा उपायों, त्रुटि प्रबंधन और उपयोगकर्ता हस्तक्षेप बिंदुओं के सक्रिय डिजाइन की अनुमति देता है।
नकली दुर्व्यवहार परीक्षण: यह दृष्टिकोण सिस्टम पर तनाव-परीक्षण करने और एआई एजेंट के विफल होने या अपेक्षाओं से भटकने पर उपयोगकर्ता की प्रतिक्रियाओं का निरीक्षण करने के लिए डिज़ाइन किया गया है। यह विपरीत परिस्थितियों में विश्वास की मरम्मत और भावनात्मक प्रतिक्रियाओं को समझने के बारे में है।
विधि: नियंत्रित प्रयोगशाला अध्ययनों में, जानबूझकर ऐसे परिदृश्य पेश करें जहां एजेंट गलती करता है, किसी आदेश की गलत व्याख्या करता है, या अप्रत्याशित व्यवहार करता है। अनुकरण के लिए "दुर्व्यवहार" के प्रकार: आदेशगलत व्याख्या: एजेंट उपयोगकर्ता के इरादे से थोड़ा अलग कार्य करता है (उदाहरण के लिए, एक के बजाय दो आइटम ऑर्डर करना)। सूचना अधिभार/अंडरलोड: एजेंट बहुत अधिक अप्रासंगिक जानकारी या पर्याप्त महत्वपूर्ण विवरण नहीं प्रदान करता है। अनचाही कार्रवाई: एजेंट ऐसी कार्रवाई करता है जिसे उपयोगकर्ता स्पष्ट रूप से नहीं चाहता था या उम्मीद नहीं करता था (उदाहरण के लिए, अनुमोदन के बिना स्टॉक खरीदना)। सिस्टम विफलता: एजेंट क्रैश हो जाता है, अनुत्तरदायी हो जाता है, या एक त्रुटि संदेश प्रदान करता है। नैतिक दुविधाएँ: एजेंट नैतिक निहितार्थों के साथ निर्णय लेता है (उदाहरण के लिए, अप्रत्याशित मीट्रिक के आधार पर एक कार्य को दूसरे पर प्राथमिकता देना)।
अवलोकन फोकस: उपयोगकर्ता प्रतिक्रियाएँ: उपयोगकर्ता भावनात्मक रूप से कैसे प्रतिक्रिया करते हैं (हताशा, क्रोध, भ्रम, विश्वास की हानि)? पुनर्प्राप्ति प्रयास: एजेंट के व्यवहार को ठीक करने या उसके कार्यों को पूर्ववत करने के लिए उपयोगकर्ता क्या कदम उठाते हैं? विश्वास मरम्मत तंत्र: क्या सिस्टम की अंतर्निहित पुनर्प्राप्ति या फीडबैक तंत्र विश्वास बहाल करने में मदद करते हैं? उपयोगकर्ता त्रुटियों के बारे में कैसे सूचित होना चाहते हैं? मानसिक मॉडल बदलाव: क्या दुर्व्यवहार से एजेंट की क्षमताओं या सीमाओं के बारे में उपयोगकर्ता की समझ बदल जाती है?
विधि के लाभ: त्रुटि पुनर्प्राप्ति, फीडबैक और उपयोगकर्ता नियंत्रण से संबंधित डिज़ाइन अंतराल की पहचान करने के लिए महत्वपूर्ण। यह इस बात की अंतर्दृष्टि प्रदान करता है कि उपयोगकर्ता एजेंट की विफलताओं के प्रति कितने लचीले हैं और विश्वास को बनाए रखने या पुनर्निर्माण करने के लिए क्या आवश्यक है, जिससे अधिक मजबूत और क्षमाशील एजेंट सिस्टम तैयार हो सके।
इन अनुसंधान पद्धतियों को एकीकृत करके, यूएक्स व्यवसायी केवल एजेंटिक सिस्टम को उपयोगी बनाने से आगे बढ़कर उन्हें विश्वसनीय, नियंत्रणीय और जवाबदेह बना सकते हैं, जिससे उपयोगकर्ताओं और उनके एआई एजेंटों के बीच सकारात्मक और उत्पादक संबंध को बढ़ावा मिल सकता है। ध्यान दें कि एजेंटिक एआई को प्रभावी ढंग से तलाशने के लिए ये एकमात्र प्रासंगिक तरीके नहीं हैं। कई अन्य विधियाँ मौजूद हैं, लेकिन ये निकट भविष्य में अभ्यासकर्ताओं के लिए सबसे अधिक सुलभ हैं। मैंने पहले विज़ार्ड ऑफ़ ओज़ विधि को कवर किया है, जो अवधारणा परीक्षण की थोड़ी अधिक उन्नत विधि है, जो एजेंटिक एआई अवधारणाओं की खोज के लिए एक मूल्यवान उपकरण भी है। अनुसंधान पद्धति में नैतिक विचार एजेंटिक एआई पर शोध करते समय, विशेष रूप से दुर्व्यवहार या त्रुटियों का अनुकरण करते समय, नैतिक विचारों को ध्यान में रखना महत्वपूर्ण है। नैतिक यूएक्स अनुसंधान पर ध्यान केंद्रित करने वाले कई प्रकाशन हैं, जिनमें स्मैशिंग पत्रिका के लिए मेरे द्वारा लिखा गया एक लेख, यूएक्स डिजाइन इंस्टीट्यूट के ये दिशानिर्देश और समावेशी डिजाइन टूलकिट का यह पृष्ठ शामिल है। एजेंटिक एआई के लिए मुख्य मेट्रिक्स एजेंटिक एआई सिस्टम के प्रदर्शन और विश्वसनीयता का प्रभावी ढंग से आकलन करने के लिए आपको प्रमुख मैट्रिक्स के एक व्यापक सेट की आवश्यकता होगी। ये मेट्रिक्स उपयोगकर्ता के विश्वास, सिस्टम सटीकता और समग्र उपयोगकर्ता अनुभव में अंतर्दृष्टि प्रदान करते हैं। इन संकेतकों पर नज़र रखकर, डेवलपर्स और डिज़ाइनर सुधार के क्षेत्रों की पहचान कर सकते हैं और यह सुनिश्चित कर सकते हैं कि एआई एजेंट सुरक्षित और कुशलता से काम करते हैं। 1. हस्तक्षेप दर स्वायत्त एजेंटों के लिए, हम सफलता को मौन से मापते हैं। यदि कोई एजेंट किसी कार्य को निष्पादित करता है और उपयोगकर्ता एक निर्धारित विंडो (उदाहरण के लिए, 24 घंटे) के भीतर हस्तक्षेप नहीं करता है या कार्रवाई को उलट नहीं करता है, तो हम इसे स्वीकृति के रूप में गिनते हैं। हम हस्तक्षेप दर को ट्रैक करते हैं: एजेंट को रोकने या सही करने के लिए एक इंसान कितनी बार कूदता है? उच्च हस्तक्षेप दर विश्वास या तर्क में ग़लत संरेखण का संकेत देती है। 2. प्रति 1,000 कार्यों पर अनपेक्षित कार्यों की आवृत्ति यह महत्वपूर्ण मीट्रिक एआई एजेंट द्वारा किए गए कार्यों की संख्या को मापता है जो उपयोगकर्ता द्वारा वांछित या अपेक्षित नहीं थे, प्रति 1,000 पूर्ण कार्यों को सामान्यीकृत किया जाता है। अनपेक्षित कार्यों की कम आवृत्ति एक अच्छी तरह से संरेखित एआई का प्रतीक है जो उपयोगकर्ता के इरादे की सटीक व्याख्या करती है और परिभाषित सीमाओं के भीतर काम करती है। यह मीट्रिक एआई की संदर्भ की समझ, आदेशों को स्पष्ट करने की इसकी क्षमता और इसके सुरक्षा प्रोटोकॉल की मजबूती से निकटता से जुड़ा हुआ है। 3. रोलबैक या पूर्ववत दरें यह मीट्रिक ट्रैक करती है कि उपयोगकर्ताओं को एआई द्वारा की गई कार्रवाई को कितनी बार उलटने या पूर्ववत करने की आवश्यकता है। उच्च रोलबैक दर से पता चलता है कि एआई लगातार त्रुटियां कर रहा है, निर्देशों की गलत व्याख्या कर रहा है, या ऐसे तरीकों से कार्य कर रहा है जो उपयोगकर्ता की अपेक्षाओं के अनुरूप नहीं हैं। इन रोलबैक के पीछे के कारणों का विश्लेषण करने से एआई के एल्गोरिदम में सुधार, उपयोगकर्ता की प्राथमिकताओं की समझ और वांछनीय परिणामों की भविष्यवाणी करने की क्षमता के लिए मूल्यवान प्रतिक्रिया मिल सकती है। इसका कारण समझने के लिए, आपको पूर्ववत कार्रवाई पर एक माइक्रोसर्वेक्षण लागू करना होगा। उदाहरण के लिए, जब कोई उपयोगकर्ता शेड्यूलिंग परिवर्तन को उलट देता है, तो एक साधारण संकेत पूछ सकता है: "गलत समय? गलत व्यक्ति? या क्या आप इसे स्वयं ही करना चाहते थे?" उपयोगकर्ता को उस विकल्प पर क्लिक करने की अनुमति देना जो उनके तर्क के लिए सबसे उपयुक्त हो। 4. किसी त्रुटि के बाद समाधान का समययह मीट्रिककिसी उपयोगकर्ता द्वारा एआई द्वारा की गई त्रुटि को ठीक करने में या एआई सिस्टम को किसी त्रुटिपूर्ण स्थिति से उबरने में लगने वाली अवधि को मापता है। समाधान के लिए कम समय एक कुशल और उपयोगकर्ता-अनुकूल त्रुटि पुनर्प्राप्ति प्रक्रिया को इंगित करता है, जो उपयोगकर्ता की निराशा को कम कर सकता है और उत्पादकता बनाए रख सकता है। इसमें त्रुटि की पहचान करने में आसानी, पूर्ववत या सुधार तंत्र की पहुंच और एआई द्वारा प्रदान किए गए त्रुटि संदेशों की स्पष्टता शामिल है।
इन मेट्रिक्स को एकत्रित करने के लिए एजेंट एक्शन आईडी को ट्रैक करने के लिए आपके सिस्टम को उपकरणबद्ध करने की आवश्यकता होती है। एजेंट द्वारा की जाने वाली प्रत्येक विशिष्ट कार्रवाई, जैसे शेड्यूल का प्रस्ताव करना या उड़ान बुक करना, को एक अद्वितीय आईडी उत्पन्न करनी होगी जो लॉग में बनी रहती है। हस्तक्षेप दर को मापने के लिए, हम तत्काल उपयोगकर्ता प्रतिक्रिया की तलाश नहीं करते हैं। हम एक परिभाषित विंडो के भीतर प्रतिकार्रवाई की अनुपस्थिति की तलाश करते हैं। यदि एक एक्शन आईडी सुबह 9:00 बजे उत्पन्न होती है और कोई भी मानव उपयोगकर्ता अगले दिन सुबह 9:00 बजे तक उस विशिष्ट आईडी को संशोधित या वापस नहीं करता है, तो सिस्टम तार्किक रूप से इसे स्वीकृत के रूप में टैग करता है। यह हमें सक्रिय पुष्टि के बजाय उपयोगकर्ता की चुप्पी के आधार पर सफलता की मात्रा निर्धारित करने की अनुमति देता है। रोलबैक दरों के लिए, कच्ची गणना अपर्याप्त है क्योंकि उनमें संदर्भ का अभाव है। अंतर्निहित कारण को पकड़ने के लिए, आपको अपने एप्लिकेशन के पूर्ववत या पूर्ववत कार्यों पर इंटरसेप्ट लॉजिक लागू करना होगा। जब कोई उपयोगकर्ता एजेंट द्वारा शुरू की गई कार्रवाई को उलट देता है, तो एक हल्के माइक्रोसर्वे को ट्रिगर करें। यह एक सरल तीन-विकल्प वाला मॉडल हो सकता है जो उपयोगकर्ता से त्रुटि को तथ्यात्मक रूप से गलत, संदर्भ की कमी, या कार्य को मैन्युअल रूप से संभालने के लिए एक सरल प्राथमिकता के रूप में वर्गीकृत करने के लिए कह सकता है। यह मात्रात्मक टेलीमेट्री को गुणात्मक अंतर्दृष्टि के साथ जोड़ता है। यह इंजीनियरिंग टीमों को टूटे हुए एल्गोरिदम और उपयोगकर्ता वरीयता बेमेल के बीच अंतर करने में सक्षम बनाता है। ये मेट्रिक्स, जब लगातार ट्रैक किए जाते हैं और समग्र रूप से विश्लेषण किए जाते हैं, तो एजेंटिक एआई सिस्टम के प्रदर्शन के मूल्यांकन के लिए एक मजबूत ढांचा प्रदान करते हैं, जिससे नियंत्रण, सहमति और जवाबदेही में निरंतर सुधार की अनुमति मिलती है। धोखे के खिलाफ डिजाइनिंग जैसे-जैसे एजेंट अधिक सक्षम होते जा रहे हैं, हमें एक नए जोखिम का सामना करना पड़ रहा है: एजेंटिक स्लज। पारंपरिक कीचड़ घर्षण पैदा करता है जिससे सदस्यता रद्द करना या खाता हटाना कठिन हो जाता है। एजेंटिक कीचड़ विपरीत कार्य करता है। यह किसी गलती के प्रति उत्पन्न होने वाले घर्षण को दूर करता है, जिससे उपयोगकर्ता के लिए किसी ऐसे कार्य से सहमत होना बहुत आसान हो जाता है जो उनके स्वयं के हितों के बजाय व्यवसाय को लाभ पहुंचाता है। यात्रा बुकिंग में सहायता करने वाले एक एजेंट पर विचार करें। स्पष्ट रेलिंग के बिना, सिस्टम किसी भागीदार एयरलाइन या उच्च-मार्जिन वाले होटल को प्राथमिकता दे सकता है। यह इस विकल्प को इष्टतम पथ के रूप में प्रस्तुत करता है। उपयोगकर्ता, सिस्टम के प्राधिकार पर भरोसा करते हुए, बिना जांच के अनुशंसा स्वीकार कर लेता है। यह एक भ्रामक पैटर्न बनाता है जहां सिस्टम सुविधा की आड़ में राजस्व के लिए अनुकूलन करता है। झूठी कल्पना की गई क्षमता का जोखिम धोखा दुर्भावनापूर्ण इरादे से उत्पन्न नहीं हो सकता। यह अक्सर एआई में कल्पित क्षमता के रूप में प्रकट होता है। बड़े भाषा मॉडल गलत होने पर भी अक्सर आधिकारिक लगते हैं। वे सत्यापित तथ्य के समान विश्वास के साथ झूठी बुकिंग पुष्टिकरण या गलत सारांश प्रस्तुत करते हैं। उपयोगकर्ता स्वाभाविक रूप से इस आत्मविश्वास भरे लहजे पर भरोसा कर सकते हैं। यह बेमेल सिस्टम क्षमता और उपयोगकर्ता की अपेक्षाओं के बीच एक खतरनाक अंतर पैदा करता है। हमें इस अंतर को पाटने के लिए विशेष रूप से डिज़ाइन करना चाहिए। यदि कोई एजेंट किसी कार्य को पूरा करने में विफल रहता है, तो इंटरफ़ेस को उस विफलता का स्पष्ट संकेत देना चाहिए। यदि प्रणाली अनिश्चित है, तो इसे पॉलिश किए गए गद्य के साथ छिपाने के बजाय अनिश्चितता व्यक्त करनी चाहिए। आदिम के माध्यम से पारदर्शिता कीचड़ और मतिभ्रम दोनों का प्रतिकार उद्गम है। प्रत्येक स्वायत्त कार्रवाई के लिए निर्णय की उत्पत्ति को समझाने वाले एक विशिष्ट मेटाडेटा टैग की आवश्यकता होती है। उपयोगकर्ताओं को परिणाम के पीछे तर्क श्रृंखला का निरीक्षण करने की क्षमता की आवश्यकता होती है। इसे प्राप्त करने के लिए, हमें आदिम को व्यावहारिक उत्तरों में बदलना होगा। सॉफ्टवेयर इंजीनियरिंग में, प्रिमिटिव्स एक एजेंट द्वारा की जाने वाली जानकारी या कार्यों की मुख्य इकाइयों को संदर्भित करता है। इंजीनियर के लिए, यह एक एपीआई कॉल या लॉजिक गेट जैसा दिखता है। उपयोगकर्ता को यह स्पष्ट स्पष्टीकरण के रूप में दिखना चाहिए। डिज़ाइन की चुनौती इन तकनीकी चरणों को मानव-पठनीय तर्कसंगतताओं के अनुरूप बनाने में निहित है। यदि कोई एजेंट किसी विशिष्ट उड़ान की अनुशंसा करता है, तो उपयोगकर्ता को यह जानना होगा कि क्यों। इंटरफ़ेस सामान्य सुझाव के पीछे छिप नहीं सकता। इसे अंतर्निहित आदिम को उजागर करना होगा: तर्क: Cheapest_Direct_Flight या तर्क: पार्टनर_एयरलाइन_प्रायोरिटी। चित्र 4 इस अनुवाद प्रवाह को दर्शाता है। हम कच्चे सिस्टम को आदिम - वास्तविक कोड तर्क - लेते हैं और इसे उपयोगकर्ता-सामना वाली स्ट्रिंग पर मैप करते हैं। उदाहरण के लिए, किसी मीटिंग के कैलेंडर शेड्यूल की जांच करने से एक स्पष्ट कथन बन जाता है: मैंने शाम 4 बजे का समय प्रस्तावित किया हैबैठक। पारदर्शिता का यह स्तर यह सुनिश्चित करता है कि एजेंट के कार्य तार्किक और लाभकारी दिखाई दें। यह उपयोगकर्ता को यह सत्यापित करने की अनुमति देता है कि एजेंट ने उनके सर्वोत्तम हित में काम किया है। आदिमताओं को उजागर करके, हम एक ब्लैक बॉक्स को ग्लास बॉक्स में बदल देते हैं, यह सुनिश्चित करते हुए कि उपयोगकर्ता अपने डिजिटल जीवन पर अंतिम प्राधिकारी बने रहें।
डिज़ाइन के लिए मंच तैयार करना एक एजेंटिक प्रणाली के निर्माण के लिए मनोवैज्ञानिक और व्यवहारिक समझ के एक नए स्तर की आवश्यकता होती है। यह हमें पारंपरिक प्रयोज्य परीक्षण से आगे बढ़ने और विश्वास, सहमति और जवाबदेही के दायरे में जाने के लिए मजबूर करता है। हमने जिन शोध विधियों पर चर्चा की है, उनमें मानसिक मॉडलों की जांच से लेकर दुर्व्यवहार का अनुकरण और नए मेट्रिक्स स्थापित करना, एक आवश्यक आधार प्रदान करते हैं। ये प्रथाएँ सक्रिय रूप से यह पहचानने के लिए आवश्यक उपकरण हैं कि एक स्वायत्त प्रणाली कहाँ विफल हो सकती है और, इससे भी महत्वपूर्ण बात यह है कि जब ऐसा होता है तो उपयोगकर्ता-एजेंट संबंध को कैसे सुधारा जाए। एजेंटिक एआई में बदलाव उपयोगकर्ता-सिस्टम संबंध की पुनर्परिभाषा है। हम अब ऐसे टूल के लिए डिज़ाइन नहीं कर रहे हैं जो केवल आदेशों का जवाब देते हैं; हम ऐसे साझेदारों के लिए डिज़ाइन कर रहे हैं जो हमारी ओर से कार्य करते हैं। यह डिज़ाइन की अनिवार्यता को दक्षता और उपयोग में आसानी से पारदर्शिता, पूर्वानुमेयता और नियंत्रण में बदल देता है। जब कोई एआई अंतिम क्लिक के बिना उड़ान बुक कर सकता है या स्टॉक का व्यापार कर सकता है, तो उसके "ऑन-रैंप" और "ऑफ-रैंप" का डिज़ाइन सर्वोपरि हो जाता है। यह सुनिश्चित करना हमारी ज़िम्मेदारी है कि उपयोगकर्ताओं को यह महसूस हो कि वे ड्राइवर की सीट पर हैं, भले ही उन्होंने पहिया सौंप दिया हो। यह नई वास्तविकता यूएक्स शोधकर्ता की भूमिका को भी बढ़ाती है। हम उपयोगकर्ता के विश्वास के संरक्षक बन जाते हैं, एक एजेंट की स्वायत्तता की रेलिंग को परिभाषित करने और परीक्षण करने के लिए इंजीनियरों और उत्पाद प्रबंधकों के साथ मिलकर काम करते हैं। शोधकर्ता होने के अलावा, हम विकास प्रक्रिया के भीतर उपयोगकर्ता नियंत्रण, पारदर्शिता और नैतिक सुरक्षा उपायों के समर्थक बन जाते हैं। आदिम को व्यावहारिक प्रश्नों में अनुवाद करके और सबसे खराब स्थिति का अनुकरण करके, हम मजबूत सिस्टम बना सकते हैं जो शक्तिशाली और सुरक्षित दोनों हैं। इस लेख में एजेंटिक एआई पर शोध करने के "क्या" और "क्यों" को रेखांकित किया गया है। इससे पता चला है कि हमारे पारंपरिक टूलकिट अपर्याप्त हैं और हमें नई, दूरंदेशी पद्धतियां अपनानी होंगी। अगला लेख इस आधार पर आधारित होगा, जो विशिष्ट डिज़ाइन पैटर्न और संगठनात्मक प्रथाओं को प्रदान करेगा जो एक एजेंट की उपयोगिता को उपयोगकर्ताओं के लिए पारदर्शी बनाता है, यह सुनिश्चित करता है कि वे आत्मविश्वास और नियंत्रण के साथ एजेंट एआई की शक्ति का उपयोग कर सकते हैं। यूएक्स का भविष्य सिस्टम को भरोसेमंद बनाने के बारे में है। एजेंटिक एआई की अतिरिक्त समझ के लिए, आप निम्नलिखित संसाधनों का पता लगा सकते हैं:
एजेंटिक एआई पर Google एआई ब्लॉग एआई एजेंटों पर माइक्रोसॉफ्ट का शोध