აგენტური AI მზადაა გარდაქმნას მომხმარებელთა გამოცდილება და ოპერაციული ეფექტურობა, რაც საჭიროებს ხელმძღვანელობის ახალ სტრატეგიულ მიდგომას. ხელოვნური ინტელექტის ეს ევოლუცია სისტემებს აძლევს უფლებას დაგეგმონ, შეასრულონ და განაგრძონ ამოცანები, გადავიდნენ მარტივი რეკომენდაციების მიღმა პროაქტიულ ქმედებებზე. UX გუნდებისთვის, პროდუქტის მენეჯერებისთვის და აღმასრულებლებისთვის, ამ ცვლილების გაგება გადამწყვეტია ინოვაციებში შესაძლებლობების გასახსნელად, სამუშაო ნაკადების გამარტივებისთვის და ხელახლა განსაზღვრისთვის, თუ როგორ ემსახურება ტექნოლოგია ადამიანებს. მარტივია აგენტური ხელოვნური ინტელექტის აღრევა Robotic Process Automation-თან (RPA), რომელიც არის ტექნოლოგია, რომელიც ფოკუსირებულია კომპიუტერებზე შესრულებულ წესებზე დაფუძნებულ ამოცანებზე. განსხვავება მდგომარეობს სიხისტესა და მსჯელობაში. RPA შესანიშნავად იცავს მკაცრი სკრიპტის: თუ X მოხდა, გააკეთე Y. ის მიბაძავს ადამიანის ხელებს. აგენტური AI მიბაძავს ადამიანის მსჯელობას. ის არ მიჰყვება ხაზოვან დამწერლობას; ის ქმნის ერთს. განიხილეთ რეკრუტირების სამუშაო პროცესი. RPA ბოტს შეუძლია რეზიუმეს სკანირება და მონაცემთა ბაზაში ატვირთვა. ის შესანიშნავად ასრულებს განმეორებით დავალებას. აგენტური სისტემა უყურებს რეზიუმეს, შენიშნავს, რომ კანდიდატი ჩამოთვლის კონკრეტულ სერტიფიკატს, აცნობებს ახალ კლიენტის მოთხოვნას და გადაწყვეტს შეადგინოს პერსონალიზებული ელფოსტა, რომელიც ხაზს უსვამს ამ შესაბამისობას. RPA ახორციელებს წინასწარ განსაზღვრულ გეგმას; აგენტური AI აყალიბებს გეგმას მიზნის საფუძველზე. ეს ავტონომია განასხვავებს აგენტებს პროგნოზირების ინსტრუმენტებისგან, რომლებსაც ჩვენ ვიყენებდით ბოლო ათწლეულის განმავლობაში. კიდევ ერთი მაგალითია შეხვედრების კონფლიქტების მართვა. თქვენს კალენდარში ინტეგრირებულმა პროგნოზირებულმა მოდელმა შესაძლოა გააანალიზოს თქვენი შეხვედრების განრიგი და თქვენი კოლეგების განრიგი. შემდეგ შეიძლება მიუთითებდეს პოტენციურ კონფლიქტებზე, როგორიცაა ერთდროულად დაგეგმილი ორი მნიშვნელოვანი შეხვედრა, ან დაგეგმილი შეხვედრა, როდესაც მთავარი მონაწილე შვებულებაშია. ის გაწვდით ინფორმაციას და მიუთითებს პოტენციურ საკითხებზე, მაგრამ თქვენ ხართ პასუხისმგებელი ქმედებებზე. აგენტური AI, იმავე სცენარში, სცილდება მხოლოდ კონფლიქტების თავიდან აცილების შეთავაზებას. მთავარ მონაწილესთან კონფლიქტის იდენტიფიცირებისას აგენტს შეუძლია იმოქმედოს შემდეგნაირად:

ყველა საჭირო მონაწილის ხელმისაწვდომობის შემოწმება. ალტერნატიული დროის სლოტების იდენტიფიცირება, რომელიც მუშაობს ყველასთვის. შემოთავაზებული ახალი შეხვედრის მოსაწვევების გაგზავნა ყველა დამსწრესთვის. თუ კონფლიქტი არის გარე მონაწილესთან, აგენტს შეუძლია შეადგინოს და გაუგზავნოს ელფოსტა, სადაც განმარტავს გადაგეგმვის აუცილებლობას და შესთავაზებს ალტერნატიულ დროს. თქვენი კალენდრისა და თქვენი კოლეგების კალენდრების განახლება შეხვედრის ახალი დეტალებით დადასტურების შემდეგ.

ამ აგენტურ AI-ს ესმის მიზანი (შეხვედრის კონფლიქტის მოგვარება), გეგმავს ნაბიჯებს (ხელმისაწვდომობის შემოწმება, ალტერნატივის პოვნა, მოწვევის გაგზავნა), ასრულებს ამ ნაბიჯებს და გრძელდება კონფლიქტის მოგვარებამდე, ეს ყველაფერი მომხმარებლის მინიმალური პირდაპირი ჩარევით. ეს აჩვენებს "აგენტურ" განსხვავებას: სისტემა დგამს პროაქტიულ ნაბიჯებს მომხმარებლისთვის, ვიდრე უბრალოდ მომხმარებლისთვის ინფორმაციის მიწოდებას. აგენტური AI სისტემებს ესმით მიზანი, გეგმავენ ნაბიჯების სერიას მის მისაღწევად, შეასრულეთ ეს ნაბიჯები და ადაპტირებაც კი, თუ რამე არასწორედ წავა. იფიქრეთ იმაზე, როგორც პროაქტიული ციფრული ასისტენტი. ძირითადი ტექნოლოგია ხშირად აერთიანებს დიდ ენობრივ მოდელებს (LLM) გაგებისა და მსჯელობისთვის, დაგეგმვის ალგორითმებთან, რომლებიც არღვევს რთულ ამოცანებს მართვად ქმედებებად. ამ აგენტებს შეუძლიათ ურთიერთქმედება სხვადასხვა ინსტრუმენტებთან, API-ებთან და კიდევ სხვა AI მოდელებთან, რათა მიაღწიონ თავიანთ მიზნებს, და კრიტიკულად, მათ შეუძლიათ შეინარჩუნონ მდგრადი მდგომარეობა, რაც ნიშნავს, რომ ახსოვთ წინა ქმედებები და აგრძელებენ მუშაობას მიზნისკენ დროთა განმავლობაში. ეს მათ ძირეულად განასხვავებს ტიპიური გენერაციული AI-სგან, რომელიც ჩვეულებრივ ასრულებს ერთ მოთხოვნას და შემდეგ გადაიტვირთება. აგენტური ქცევების მარტივი ტაქსონომია ჩვენ შეგვიძლია აგენტის ქცევა დავყოთ ავტონომიის ოთხ განსხვავებულ რეჟიმად. მიუხედავად იმისა, რომ ისინი ხშირად პროგრესირებას ჰგავს, ისინი ფუნქციონირებენ როგორც დამოუკიდებელი ოპერაციული რეჟიმები. მომხმარებელი შეიძლება ენდოს აგენტს, რომ დამოუკიდებლად იმოქმედოს დაგეგმვისთვის, მაგრამ შეინარჩუნოს ის ფინანსური ტრანზაქციების „შემოთავაზების რეჟიმში“. ჩვენ მივიღეთ ეს დონეები ავტონომიური მანქანების ინდუსტრიის სტანდარტების ადაპტაციით (SAE დონეები) მომხმარებლის გამოცდილების ციფრულ კონტექსტთან. დააკვირდი-და-შეთავაზებ აგენტი მონიტორის ფუნქციას ასრულებს. ის აანალიზებს მონაცემთა ნაკადებს და აფიქსირებს ანომალიებს ან შესაძლებლობებს, მაგრამ არ იღებს ქმედებებს. დიფერენციაცია შემდეგი დონისგან განსხვავებით, აგენტი არ ქმნის კომპლექსურ გეგმას. პრობლემაზე მიუთითებს. ExampleA DevOps აგენტი შენიშნავს სერვერის CPU-ის მატებას და აფრთხილებს მოწოდებულ ინჟინერს. მან არ იცის როგორ ან ცდილობს გამოსწორებას, მაგრამ იცის, რომ რაღაც არასწორია. გავლენა დიზაინზე და ზედამხედველობაზე ამ დონეზე,დიზაინმა და ზედამხედველობამ პრიორიტეტული უნდა იყოს მკაფიო, არაინტრუზიული შეტყობინებები და კარგად განსაზღვრული პროცესი, რათა მომხმარებლები იმოქმედონ წინადადებებზე. აქცენტი კეთდება მომხმარებლისთვის დროული და შესაბამისი ინფორმაციის მიწოდებაზე კონტროლის გარეშე. UX-ის პრაქტიკოსებმა ყურადღება უნდა გაამახვილონ წინადადებების მკაფიო და ადვილად გასაგებად გაკეთებაზე, ხოლო პროდუქტის მენეჯერებმა უნდა უზრუნველყონ, რომ სისტემა უზრუნველყოფს ღირებულებას მომხმარებლის გადაჭარბების გარეშე. დაგეგმე და შესთავაზე აგენტი განსაზღვრავს მიზანს და ქმნის მრავალსაფეხურიან სტრატეგიას მის მისაღწევად. იგი წარმოადგენს ადამიანის განხილვის სრულ გეგმას. დიფერენციაცია აგენტი მოქმედებს როგორც სტრატეგი. ის არ ახორციელებს; იგი ელოდება დამტკიცებას მთელი მიდგომის შესახებ. მაგალითი იგივე DevOps აგენტი ამჩნევს CPU-ს მწვერვალს, აანალიზებს ჟურნალებს და გვთავაზობს გამოსწორების გეგმას:

დაატრიალეთ ორი დამატებითი შემთხვევა. გადატვირთეთ დატვირთვის ბალანსერი. დაარქივეთ ძველი ჟურნალები.

ადამიანი განიხილავს ლოგიკას და დააწკაპუნებს "გეგმის დამტკიცებაზე". ზეგავლენა დიზაინსა და ზედამხედველობაზე აგენტებისთვის, რომლებიც გეგმავენ და გვთავაზობენ, დიზაინმა უნდა უზრუნველყოს შემოთავაზებული გეგმების ადვილად გასაგები და რომ მომხმარებლებს აქვთ ინტუიციური გზები მათი შესაცვლელად ან უარსაყოფად. ზედამხედველობა გადამწყვეტია წინადადებების ხარისხისა და აგენტის დაგეგმვის ლოგიკის მონიტორინგისთვის. UX პრაქტიკოსებმა უნდა შეიმუშავონ შემოთავაზებული გეგმების მკაფიო ვიზუალიზაცია, ხოლო პროდუქტის მენეჯერებმა უნდა ჩამოაყალიბონ მკაფიო განხილვისა და დამტკიცების სამუშაო ნაკადები. აქტი-დადასტურებით აგენტი ასრულებს ყველა მოსამზადებელ სამუშაოს და ათავსებს საბოლოო მოქმედებას დადგმულ მდგომარეობაში. ის ეფექტურად აკავებს კარს ღიად და ელოდება ქნევას. დიფერენციაცია ეს განსხვავდება „დაგეგმვა და შეთავაზებისგან“, რადგან ნამუშევარი უკვე შესრულებულია და დადგმულია. ის ამცირებს ხახუნს. მომხმარებელი ადასტურებს შედეგს და არა სტრატეგიას. მაგალითიA რეკრუტირების აგენტი ამზადებს ხუთ ინტერვიუს მოსაწვევს, პოულობს ღია საათებს კალენდრებში და ქმნის კალენდარულ მოვლენებს. იგი წარმოადგენს ღილაკს "ყველას გაგზავნა". მომხმარებელი იძლევა საბოლოო ავტორიზაციას გარე მოქმედების გასააქტიურებლად. ზეგავლენა დიზაინსა და ზედამხედველობაზე როცა აგენტები მოქმედებენ დადასტურებით, დიზაინმა უნდა უზრუნველყოს დაგეგმილი მოქმედების გამჭვირვალე და ლაკონური რეზიუმეები, ნათლად ასახავდეს პოტენციურ შედეგებს. ზედამხედველობამ უნდა გადაამოწმოს, რომ დადასტურების პროცესი მტკიცეა და რომ მომხმარებლებს არ სთხოვენ მოქმედებების ბრმად დამტკიცებას. UX პრაქტიკოსებმა უნდა შეიმუშავონ დადასტურების მოთხოვნები, რომლებიც მკაფიოა და უზრუნველყოფენ ყველა საჭირო ინფორმაციას, ხოლო პროდუქტის მენეჯერებმა პრიორიტეტი უნდა მიანიჭონ მტკიცე აუდიტის კვალს ყველა დადასტურებული ქმედებისთვის. აქტი-ავტონომიურად აგენტი დამოუკიდებლად ასრულებს დავალებებს განსაზღვრულ საზღვრებში. Differentiationმომხმარებელი განიხილავს მოქმედებების ისტორიას და არა თავად მოქმედებებს. მაგალითი რეკრუტირების აგენტი ხედავს კონფლიქტს, გადააქვს ინტერვიუ სარეზერვო სლოტზე, განაახლებს კანდიდატს და აცნობებს დაქირავების მენეჯერს. ადამიანი ხედავს მხოლოდ შეტყობინებას: ინტერვიუ გადანაწილებულია სამშაბათს. გავლენა დიზაინსა და ზედამხედველობაზე ავტონომიური აგენტებისთვის, დიზაინმა უნდა დაადგინოს წინასწარ დამტკიცებული მკაფიო საზღვრები და უზრუნველყოს ძლიერი მონიტორინგის ინსტრუმენტები. ზედამხედველობა მოითხოვს აგენტის მუშაობის მუდმივ შეფასებას ამ საზღვრებში, კრიტიკული საჭიროება ხისტი აღრიცხვის, მკაფიო უგულებელყოფის მექანიზმებისა და მომხმარებლის მიერ განსაზღვრული მოკვლის გადამრთველების შესანარჩუნებლად მომხმარებლის კონტროლისა და ნდობის შესანარჩუნებლად. UX პრაქტიკოსებმა ყურადღება უნდა გაამახვილონ ეფექტური დაფების შექმნაზე ავტონომიური აგენტის ქცევის მონიტორინგისთვის, ხოლო პროდუქტის მენეჯერებმა უნდა უზრუნველყონ მკაფიო მმართველობა და ეთიკური მითითებები.

მოდით შევხედოთ რეალურ სამყაროში არსებულ აპლიკაციას HR ტექნოლოგიაში, რომ ნახოთ ეს რეჟიმები მოქმედებაში. განვიხილოთ „ინტერვიუს საკოორდინაციო აგენტი“, რომელიც შექმნილია დაქირავების ლოჯისტიკის მოსაგვარებლად.

შეთავაზების რეჟიმში აგენტი შენიშნავს, რომ ინტერვიუერი ორჯერ არის დაჯავშნილი. იგი ხაზს უსვამს კონფლიქტს დამსაქმებლის დაფაზე: „გაფრთხილება: სარა ორჯერ არის დაჯავშნილი ღამის 2 საათზე გასაუბრებაზე“. გეგმის რეჟიმში აგენტი აანალიზებს სარას კალენდარს და კანდიდატის ხელმისაწვდომობას. ის წარმოადგენს გამოსავალს: „გირჩევთ, ინტერვიუ გადაიტანოთ ხუთშაბათს, დილის 10 საათზე. ეს მოითხოვს სარას 1:1-ის გადატანას თავის მენეჯერთან ერთად“. რეკრუტერი განიხილავს ამ ლოგიკას. დადასტურების რეჟიმში აგენტი აგზავნის წერილებს კანდიდატსა და მენეჯერს. ის ავსებს კალენდრის მოწვევებს. დამსაქმებელი ხედავს შეჯამებას: „მზად ხართ ხუთშაბათისთვის გადასაგეგმად. განახლებების გაგზავნა?“ დამქირავებელი დააწკაპუნებს "დადასტურება". ავტონომიურ რეჟიმში აგენტი მყისიერად აგვარებს კონფლიქტს. ის პატივს სცემს წინასწარ დადგენილ წესს: „ყოველთვის მიენიჭეთ კანდიდატის ინტერვიუს პრიორიტეტი შიდა 1:1-ზე“. ის გადაადგილებს შეხვედრას და აგზავნის შეტყობინებებს. დამსაქმებელი ხედავს ჟურნალის ჩანაწერს: „გადაწყვეტილიაგანრიგის კონფლიქტი B კანდიდატისთვის“.

კვლევის პრაიმერი: რა და როგორ უნდა გამოვიკვლიოთ ეფექტური აგენტური AI განვითარება მოითხოვს მკაფიო კვლევის მიდგომას ტრადიციულ პროგრამულ უზრუნველყოფასთან ან თუნდაც გენერაციულ AI-სთან შედარებით. ხელოვნური ინტელექტის აგენტების ავტონომიური ბუნება, მათი გადაწყვეტილების მიღების უნარი და მათი პოტენციალი პროაქტიული მოქმედებისთვის საჭიროებს სპეციალიზებულ მეთოდოლოგიებს მომხმარებლის მოლოდინების გასაგებად, აგენტების კომპლექსური ქცევის დასახატად და პოტენციური წარუმატებლობის მოსალოდნელად. შემდეგი კვლევის პრაიმერი ასახავს ძირითად მეთოდებს აგენტური AI-ის ამ უნიკალური ასპექტების გასაზომად და შესაფასებლად. მენტალურ-მოდელური ინტერვიუები ეს ინტერვიუები ავლენს მომხმარებელთა წინასწარ გააზრებულ წარმოდგენებს იმის შესახებ, თუ როგორ უნდა მოიქცეს AI აგენტი. იმის ნაცვლად, რომ უბრალოდ იკითხოთ რა სურთ მომხმარებლებს, ყურადღება გამახვილებულია აგენტის შესაძლებლობებისა და შეზღუდვების შიდა მოდელების გაგებაზე. ჩვენ უნდა მოვერიდოთ მონაწილეებთან სიტყვა „აგენტის“ გამოყენებას. ის ატარებს სამეცნიერო ფანტასტიკურ ბარგს ან არის ტერმინი, რომელიც ძალიან ადვილად აირევა ადამიანურ აგენტთან, რომელიც სთავაზობს მხარდაჭერას ან მომსახურებას. ამის ნაცვლად, მოამზადეთ დისკუსია „ასისტენტების“ ან „სისტემის“ ირგვლივ. ჩვენ უნდა გავარკვიოთ, თუ სად ავლებენ მომხმარებლებს ზღვარს დამხმარე ავტომატიზაციასა და ინტრუზიულ კონტროლს შორის.

მეთოდი: სთხოვეთ მომხმარებლებს აღწერონ, დახატონ ან მოახსენონ აგენტთან მოსალოდნელი ურთიერთქმედება სხვადასხვა ჰიპოთეტურ სცენარში. ძირითადი ზონდები (ასახავს სხვადასხვა ინდუსტრიას): იმისათვის, რომ გაიგოთ სასურველი ავტომატიზაციის საზღვრები და პოტენციური შფოთვა ზედმეტი ავტომატიზაციის გარშემო, ჰკითხეთ: თუ თქვენი ფრენა გაუქმებულია, რა გსურთ სისტემამ ავტომატურად გააკეთოს? რა გაწუხებთ, თუ ამას გააკეთებდა თქვენი მკაფიო ინსტრუქციის გარეშე?

მომხმარებლის მიერ აგენტის შიდა პროცესების და აუცილებელი კომუნიკაციის გაგების შესასწავლად, ჰკითხეთ: წარმოიდგინეთ ციფრული ასისტენტი მართავს თქვენს ჭკვიან სახლს. პაკეტის მიწოდების შემთხვევაში, როგორ ფიქრობთ, რა ნაბიჯებია გადადგმული და რა ინფორმაციის მიღებას ელოდებით?

კონტროლისა და თანხმობის მოლოდინების გამოსავლენად მრავალსაფეხურიანი პროცესის ფარგლებში, ჰკითხეთ: თუ თქვენს ციფრულ ასისტენტს სთხოვთ შეხვედრის დაგეგმვას, რა ნაბიჯების გადადგმას წარმოგიდგენიათ? რა პუნქტებში ისურვებდით კონსულტაციას ან არჩევანის გაკეთებას?

მეთოდის უპირატესობები: ავლენს იმპლიციტურ დაშვებებს, ხაზს უსვამს სფეროებს, სადაც აგენტის დაგეგმილი ქცევა შეიძლება განსხვავდებოდეს მომხმარებლის მოლოდინებისგან და აცნობებს შესაბამისი კონტროლისა და უკუკავშირის მექანიზმების დიზაინს.

აგენტური მოგზაურობის რუქა: მომხმარებლის მოგზაურობის ტრადიციული რუქების მსგავსად, აგენტის მოგზაურობის რუქები კონკრეტულად ფოკუსირებულია თავად AI აგენტის მოსალოდნელ მოქმედებებზე და გადაწყვეტილების პუნქტებზე, მომხმარებლის ურთიერთქმედების პარალელურად. ეს ხელს უწყობს პოტენციური ხარვეზების პროაქტიულად იდენტიფიცირებას.

მეთოდი: შექმენით ვიზუალური რუკა, რომელიც ასახავს აგენტის მოქმედების სხვადასხვა ეტაპებს, დაწყებიდან დასრულებამდე, მათ შორის ყველა პოტენციურ მოქმედებას, გადაწყვეტილებას და გარე სისტემებთან ან მომხმარებლებთან ურთიერთქმედებას. ძირითადი ელემენტები რუკაზე: აგენტის მოქმედებები: რა კონკრეტულ დავალებებს ან გადაწყვეტილებებს ასრულებს აგენტი? ინფორმაციის შეყვანა/გამომავალი: რა მონაცემები სჭირდება აგენტს და რა ინფორმაციას ქმნის ან აწვდის მას? გადაწყვეტილების პუნქტები: სად აკეთებს აგენტი არჩევანს და რა კრიტერიუმებია ამ არჩევანისთვის? მომხმარებელთა ურთიერთქმედების ქულები: სად აწვდის მომხმარებელი შეყვანას, განიხილავს ან ამტკიცებს ქმედებებს? წარუმატებლობის წერტილები: გადამწყვეტი მნიშვნელობა აქვს კონკრეტული შემთხვევების იდენტიფიცირებას, როდესაც აგენტმა შეიძლება არასწორად მოახდინოს ინსტრუქციების ინტერპრეტაცია, არასწორი გადაწყვეტილების მიღება ან არასწორ ობიექტთან ურთიერთობა. მაგალითები: არასწორი მიმღები (მაგ., სენსიტიური ინფორმაციის გაგზავნა არასწორი პირისთვის), ოვერდრაფტი (მაგ., ავტომატური გადახდა აღემატება ხელმისაწვდომ სახსრებს), განზრახვის არასწორი ინტერპრეტაცია (მაგ., ფრენის დაჯავშნა არასწორი თარიღისთვის ორაზროვანი ენის გამო).

აღდგენის გზები: როგორ შეუძლია აგენტს ან მომხმარებელს აღდგეს ამ წარუმატებლობისგან? რა მექანიზმები არსებობს კორექტირების ან ჩარევისთვის?

მეთოდის უპირატესობები: უზრუნველყოფს აგენტის ოპერაციული ნაკადის ჰოლისტურ ხედვას, ფარული დამოკიდებულებების გამოვლენას და იძლევა გარანტიების პროაქტიულ დიზაინს, შეცდომებს და მომხმარებლის ინტერვენციის წერტილებს, რათა თავიდან აიცილოს ან შეამსუბუქოს უარყოფითი შედეგები.

არასწორი ქცევის სიმულირებული ტესტირება: ეს მიდგომა შექმნილია სისტემის სტრესის შესამოწმებლად და მომხმარებლის რეაქციებზე დასაკვირვებლად, როდესაც AI აგენტი მარცხდება ან გადაუხვევს მოლოდინებს. ეს ეხება ნდობის აღდგენისა და ემოციური რეაქციების გააზრებას არახელსაყრელ სიტუაციებში.

მეთოდი: კონტროლირებად ლაბორატორიულ კვლევებში განზრახ შემოიტანეთ სცენარები, სადაც აგენტი უშვებს შეცდომას, არასწორ ინტერპრეტაციას უკეთებს ბრძანებას ან იქცევა მოულოდნელად. სიმულაციისთვის "არასწორი ქცევის" სახეები: ბრძანებაარასწორი ინტერპრეტაცია: აგენტი ასრულებს ოდნავ განსხვავებულ მოქმედებას იმისგან, რაც მომხმარებლის განზრახვა იყო (მაგ., ერთის ნაცვლად ორი ელემენტის შეკვეთა). ინფორმაციის გადატვირთვა/დატვირთვა: აგენტი გვაწვდის ძალიან ბევრ შეუსაბამო ინფორმაციას ან არასაკმარის კრიტიკულ დეტალებს. არასასურველი ქმედება: აგენტი ახორციელებს ქმედებას, რომელიც მომხმარებელს აშკარად არ სურდა ან ელოდა (მაგ., აქციების ყიდვა დამტკიცების გარეშე). სისტემის უკმარისობა: აგენტი ავარიულად იშლება, არ რეაგირებს ან იძლევა შეცდომის შეტყობინებას. ეთიკური დილემები: აგენტი იღებს გადაწყვეტილებას ეთიკური ზეგავლენით (მაგ., პრიორიტეტს ანიჭებს ერთ ამოცანას მეორეზე, გაუთვალისწინებელი მეტრიკის საფუძველზე).

დაკვირვების ფოკუსი: მომხმარებლის რეაქციები: როგორ რეაგირებენ მომხმარებლები ემოციურად (იმედგაცრუება, გაბრაზება, დაბნეულობა, ნდობის დაკარგვა)? აღდგენის მცდელობები: რა ნაბიჯებს დგამენ მომხმარებლები აგენტის ქცევის გამოსასწორებლად ან მისი ქმედებების გასაუქმებლად? ნდობის შეკეთების მექანიზმები: სისტემის ჩაშენებული აღდგენის ან უკუკავშირის მექანიზმები ეხმარება ნდობის აღდგენას? როგორ უნდათ მომხმარებლებს ინფორმირებული შეცდომის შესახებ? გონებრივი მოდელის შეცვლა: ცვლის თუ არა არასწორი ქცევა მომხმარებლის გაგებას აგენტის შესაძლებლობების ან შეზღუდვების შესახებ?

მეთოდის უპირატესობები: გადამწყვეტი მნიშვნელობა აქვს დიზაინის ხარვეზებს, რომლებიც დაკავშირებულია შეცდომების აღდგენასთან, უკუკავშირთან და მომხმარებლის კონტროლთან. ის გვაწვდის ინფორმაციას იმის შესახებ, თუ რამდენად მდგრადი არიან მომხმარებლები აგენტების წარუმატებლობის მიმართ და რა არის საჭირო ნდობის შესანარჩუნებლად ან აღსადგენად, რაც იწვევს უფრო მტკიცე და მიმტევებელ აგენტურ სისტემებს.

ამ კვლევის მეთოდოლოგიების ინტეგრაციით, UX პრაქტიკოსებს შეუძლიათ გადავიდნენ უბრალოდ აგენტური სისტემების გამოყენებაზე, რათა გახადონ ისინი სანდო, კონტროლირებადი და ანგარიშვალდებული, რაც ხელს უწყობს პოზიტიურ და პროდუქტიულ ურთიერთობას მომხმარებლებსა და მათ AI აგენტებს შორის. გაითვალისწინეთ, რომ ეს არ არის ერთადერთი მეთოდები, რომლებიც დაკავშირებულია აგენტური AI ეფექტურად შესასწავლად. ბევრი სხვა მეთოდი არსებობს, მაგრამ ისინი უახლოეს პერიოდში ყველაზე ხელმისაწვდომია პრაქტიკოსებისთვის. მე ადრე გავაშუქე Wizard of Oz მეთოდი, კონცეფციის ტესტირების ოდნავ უფრო მოწინავე მეთოდი, რომელიც ასევე ღირებული ინსტრუმენტია აგენტური AI კონცეფციების შესასწავლად. ეთიკური მოსაზრებები კვლევის მეთოდოლოგიაში აგენტური ხელოვნური ინტელექტის კვლევისას, განსაკუთრებით არასწორი ქცევის ან შეცდომების სიმულაციისას, მნიშვნელოვანია ეთიკური მოსაზრებების გათვალისწინება. არსებობს მრავალი პუბლიკაცია, რომელიც ფოკუსირებულია ეთიკურ UX კვლევაზე, მათ შორის სტატია, რომელიც დავწერე Smashing Magazine-სთვის, ეს სახელმძღვანელო UX დიზაინის ინსტიტუტიდან და ეს გვერდი Inclusive Design Toolkit-დან. ძირითადი მეტრიკა აგენტური AI-სთვის თქვენ დაგჭირდებათ ძირითადი მეტრიკის ყოვლისმომცველი ნაკრები აგენტური AI სისტემების ეფექტურობისა და საიმედოობის ეფექტურად შესაფასებლად. ეს მეტრიკა გვაწვდის ინფორმაციას მომხმარებლის ნდობის, სისტემის სიზუსტისა და მომხმარებლის საერთო გამოცდილების შესახებ. ამ ინდიკატორების თვალყურის დევნებით, დეველოპერებს და დიზაინერებს შეუძლიათ განსაზღვრონ გაუმჯობესების სფეროები და უზრუნველყონ, რომ AI აგენტები მუშაობენ უსაფრთხოდ და ეფექტურად. 1. ინტერვენციის მაჩვენებელი ავტონომიური აგენტებისთვის ჩვენ წარმატებას ვზომავთ დუმილით. თუ აგენტი ასრულებს დავალებას და მომხმარებელი არ ჩაერევა ან არ უკუაგდებს მოქმედებას მითითებული ფანჯრის ფარგლებში (მაგ., 24 საათი), ჩვენ ამას მივიჩნევთ მიღებად. ჩვენ ვაკვირდებით ინტერვენციის სიხშირეს: რამდენად ხშირად ხტება ადამიანი აგენტის შესაჩერებლად ან გამოსასწორებლად? ინტერვენციის მაღალი მაჩვენებელი მიუთითებს ნდობის ან ლოგიკის არასწორი თანხვედრის შესახებ. 2. გაუთვალისწინებელი მოქმედებების სიხშირე 1000 ამოცანაზე ეს კრიტიკული მეტრიკა რაოდენობრივად ასახავს AI აგენტის მიერ შესრულებულ ქმედებებს, რომლებიც არ იყო სასურველი ან მოსალოდნელი მომხმარებლის მიერ, ნორმალიზებული 1000 დასრულებულ დავალებაზე. გაუთვალისწინებელი ქმედებების დაბალი სიხშირე ნიშნავს კარგად მორგებულ AI-ს, რომელიც ზუსტად განმარტავს მომხმარებლის განზრახვას და მოქმედებს განსაზღვრულ საზღვრებში. ეს მეტრიკა მჭიდროდ არის დაკავშირებული ხელოვნური ინტელექტის მიერ კონტექსტის გაგებასთან, ბრძანებების გაუგებრობის უნართან და უსაფრთხოების პროტოკოლების სიმტკიცესთან. 3. უკან დაბრუნების ან გაუქმების განაკვეთები ეს მეტრიკა აკონტროლებს, თუ რამდენად ხშირად სჭირდებათ მომხმარებლებს შეცვალონ ან გააუქმონ AI მიერ შესრულებული ქმედება. დაბრუნების მაღალი მაჩვენებლები მიუთითებს იმაზე, რომ AI უშვებს ხშირ შეცდომებს, არასწორ ინტერპრეტაციას ახდენს ინსტრუქციებზე ან მოქმედებს ისე, რომ არ შეესაბამება მომხმარებლის მოლოდინებს. ამ დაბრუნების მიზეზების ანალიზს შეუძლია ღირებული გამოხმაურება მოგვცეს ხელოვნური ინტელექტის ალგორითმების გასაუმჯობესებლად, მომხმარებლის პრეფერენციების გაგებისა და სასურველი შედეგების პროგნოზირების შესაძლებლობისთვის. იმის გასაგებად, თუ რატომ, თქვენ უნდა განახორციელოთ მიკროგამოკითხვა გაუქმების მოქმედების შესახებ. მაგალითად, როდესაც მომხმარებელი ცვლის განრიგის ცვლილებას, უბრალო მოთხოვნას შეუძლია იკითხოს: „არასწორი დრო? არასწორი ადამიანი? თუ უბრალოდ გინდოდა ამის გაკეთება?“ საშუალებას აძლევს მომხმარებელს დააწკაპუნოს იმ ვარიანტზე, რომელიც საუკეთესოდ შეესაბამება მათ მსჯელობას. 4. გადაწყვეტის დრო შეცდომის შემდეგ ეს მეტრიკაზომავს ხანგრძლივობას, რომელიც სჭირდება მომხმარებლის მიერ ხელოვნური ინტელექტის მიერ დაშვებული შეცდომის გამოსწორებას ან თავად AI სისტემის გამოსწორებას მცდარი მდგომარეობიდან. გადაწყვეტამდე ხანმოკლე დრო მიუთითებს შეცდომების აღდგენის ეფექტურ და მოსახერხებელ პროცესზე, რომელსაც შეუძლია შეამსუბუქოს მომხმარებლის იმედგაცრუება და შეინარჩუნოს პროდუქტიულობა. ეს მოიცავს შეცდომის იდენტიფიკაციის სიმარტივეს, გაუქმების ან შესწორების მექანიზმების ხელმისაწვდომობას და შეცდომის შეტყობინებების სიცხადეს, რომელიც მოწოდებულია AI-ით.

ამ მეტრიკის შეგროვება მოითხოვს თქვენი სისტემის ინსტრუმენტირებას აგენტის ქმედების ID-ების თვალყურის დევნებისთვის. აგენტის მიერ განხორციელებული ყოველი განსხვავებული ქმედება, როგორიცაა განრიგის შეთავაზება ან ფრენის დაჯავშნა, უნდა შექმნას უნიკალური ID, რომელიც რჩება ჟურნალებში. ინტერვენციის სიჩქარის გასაზომად, ჩვენ არ ვეძებთ მომხმარებლის მყისიერ რეაქციას. ჩვენ ვეძებთ კონტრ-მოქმედების არარსებობას განსაზღვრულ ფანჯარაში. თუ Action ID გენერირებულია დილის 9:00 საათზე და არცერთი ადამიანი არ ცვლის ან დააბრუნებს ამ კონკრეტულ ID-ს მეორე დღის დილის 9:00 საათისთვის, სისტემა ლოგიკურად მონიშნავს მას, როგორც მიღებული. ეს საშუალებას გვაძლევს განვსაზღვროთ წარმატება მომხმარებლის დუმილის საფუძველზე და არა აქტიური დადასტურების საფუძველზე. დაბრუნების ტარიფებისთვის, ნედლეულის რაოდენობა არასაკმარისია, რადგან მათ არ გააჩნიათ კონტექსტი. ძირითადი მიზეზის დასაფიქსირებლად, თქვენ უნდა განახორციელოთ ჩარევის ლოგიკა თქვენი აპლიკაციის გაუქმების ან დაბრუნების ფუნქციებზე. როდესაც მომხმარებელი ცვლის აგენტის მიერ წამოწყებულ ქმედებას, ჩაატარეთ მსუბუქი მიკროგამოკითხვა. ეს შეიძლება იყოს მარტივი სამი ვარიანტიანი მოდალი, რომელიც სთხოვს მომხმარებელს შეცდომის კატეგორიზაციას, როგორც ფაქტობრივად არასწორს, მოკლე კონტექსტს, ან მარტივი უპირატესობის მინიჭებას დავალების ხელით გატარებისთვის. ეს აერთიანებს რაოდენობრივ ტელემეტრიას ხარისხობრივ ინსაიტთან. ის საშუალებას აძლევს საინჟინრო გუნდებს განასხვავონ გატეხილი ალგორითმი და მომხმარებლის პრეფერენციების შეუსაბამობა. ეს მეტრიკა, თანმიმდევრულად მიკვლევისას და ჰოლისტიკური ანალიზის დროს, იძლევა მყარ ჩარჩოს აგენტური AI სისტემების მუშაობის შესაფასებლად, რაც საშუალებას იძლევა მუდმივად გაუმჯობესდეს კონტროლი, თანხმობა და ანგარიშვალდებულება. დიზაინი მოტყუების წინააღმდეგ როდესაც აგენტები უფრო და უფრო ქმედუნარიანები ხდებიან, ჩვენ ვაწყდებით ახალ რისკს: აგენტური შლამი. ტრადიციული ტალახი ქმნის ხახუნს, რაც ართულებს გამოწერის გაუქმებას ან ანგარიშის წაშლას. აგენტური ტალახი მოქმედებს საპირისპიროდ. ის ხსნის ხახუნს შეცდომის გამო, რაც აადვილებს მომხმარებლისთვის დათანხმებას ქმედებაზე, რომელიც სარგებელს მოუტანს ბიზნესს და არა საკუთარ ინტერესებს. იფიქრეთ აგენტზე, რომელიც დაგეხმარებათ მოგზაურობის დაჯავშნაში. მკაფიო დამცავი მოაჯირების გარეშე, სისტემამ შესაძლოა უპირატესობა მიანიჭოს პარტნიორ ავიაკომპანიას ან უფრო მაღალი მარჟის მქონე სასტუმროს. ის წარმოგიდგენთ ამ არჩევანს, როგორც ოპტიმალურ გზას. მომხმარებელი, რომელიც ენდობა სისტემის ავტორიტეტს, იღებს რეკომენდაციას შემოწმების გარეშე. ეს ქმნის მატყუარა ნიმუშს, სადაც სისტემა ოპტიმიზირებს შემოსავლებს მოხერხებულობის საფარქვეშ. ცრუ წარმოსახვითი კომპეტენციის რისკი მოტყუება არ შეიძლება მომდინარეობდეს ბოროტი განზრახვით. ის ხშირად ვლინდება AI-ში, როგორც წარმოსახვითი კომპეტენცია. დიდი ენობრივი მოდელები ხშირად ავტორიტეტულად ჟღერს მაშინაც კი, როცა არასწორია. ისინი წარმოადგენენ ყალბი ჯავშნის დადასტურებას ან არაზუსტ შეჯამებას იგივე ნდობით, როგორც დამოწმებული ფაქტი. მომხმარებლებმა შეიძლება ბუნებრივად ენდონ ამ თავდაჯერებულ ტონს. ეს შეუსაბამობა ქმნის საშიშ უფსკრული სისტემის შესაძლებლობებსა და მომხმარებლის მოლოდინებს შორის. ჩვენ უნდა დავაპროექტოთ სპეციალურად ამ უფსკრულის დასაძლევად. თუ აგენტი ვერ ასრულებს დავალებას, ინტერფეისმა მკაფიოდ უნდა მიანიშნებდეს ამ წარუმატებლობის შესახებ. თუ სისტემა არ არის დარწმუნებული, მან უნდა გამოხატოს გაურკვევლობა, ვიდრე დაფაროს იგი გაპრიალებული პროზით. გამჭვირვალობა Primitives-ის მეშვეობით როგორც შლამის, ასევე ჰალუცინაციის ანტიდოტი არის წარმოშობა. ყოველი ავტონომიური მოქმედება მოითხოვს სპეციფიკურ მეტამონაცემთა ტეგს, რომელიც განმარტავს გადაწყვეტილების წარმოშობას. მომხმარებლებს სჭირდებათ შედეგის მიღმა არსებული ლოგიკური ჯაჭვის შემოწმების შესაძლებლობა. ამის მისაღწევად პრიმიტივები პრაქტიკულ პასუხებად უნდა გადავაქციოთ. პროგრამული უზრუნველყოფის ინჟინერიაში, პრიმიტივები ეხება ინფორმაციის ძირითად ერთეულებს ან მოქმედებებს, რომლებსაც აგენტი ასრულებს. ინჟინრისთვის ეს API ზარს ან ლოგიკურ კარიბჭეს ჰგავს. მომხმარებლისთვის ის უნდა გამოჩნდეს როგორც მკაფიო ახსნა. დიზაინის გამოწვევა მდგომარეობს ამ ტექნიკური ნაბიჯების შედგენაში ადამიანისათვის წასაკითხად დასაბუთებაზე. თუ აგენტი გირჩევთ კონკრეტულ ფრენას, მომხმარებელმა უნდა იცოდეს რატომ. ინტერფეისი ვერ დაიმალება ზოგადი წინადადების მიღმა. მან უნდა გამოავლინოს ძირითადი პრიმიტივი: Logic: Cheapest_Direct_Flight ან Logic: Partner_Airline_Priority. სურათი 4 ასახავს ამ თარგმანის მიმდინარეობას. ჩვენ ვიღებთ ნედლეული სისტემის პრიმიტიულს - ფაქტობრივ კოდის ლოგიკას - და ვასახავთ მას მომხმარებლის მიმართულ სტრიქონზე. მაგალითად, შეხვედრის კალენდარული განრიგის პრიმიტიული შემოწმება ხდება მკაფიო განცხადება: მე შემოგთავაზეს საღამოს 4 საათი.შეხვედრა. გამჭვირვალობის ეს დონე უზრუნველყოფს აგენტის ქმედებებს ლოგიკური და მომგებიანი გამოჩნდეს. ეს საშუალებას აძლევს მომხმარებელს გადაამოწმოს, რომ აგენტი მოქმედებდა მათი საუკეთესო ინტერესების შესაბამისად. პრიმიტივების გამოვლენით, ჩვენ გარდაქმნით შავ ყუთს შუშის ყუთად, რაც უზრუნველყოფს, რომ მომხმარებლები დარჩნენ საბოლოო ავტორიტეტი საკუთარ ციფრულ ცხოვრებაში.

დიზაინის ეტაპის დაყენება აგენტური სისტემის შექმნა მოითხოვს ფსიქოლოგიური და ქცევითი გაგების ახალ დონეს. ის გვაიძულებს გადავიდეთ ჩვეულებრივი გამოყენებადობის ტესტირების მიღმა და ნდობის, თანხმობისა და ანგარიშვალდებულების სფეროში. კვლევის მეთოდები, რომლებიც ჩვენ განვიხილეთ, გონებრივი მოდელების გამოკვლევიდან დაწყებული არასწორი ქცევის სიმულაციამდე და ახალი მეტრიკის ჩამოყალიბებამდე, უზრუნველყოფს აუცილებელ საფუძველს. ეს პრაქტიკა არის არსებითი ინსტრუმენტები პროაქტიული იდენტიფიკაციისთვის, თუ სად შეიძლება ჩავარდეს ავტონომიური სისტემა და, რაც მთავარია, როგორ გამოვასწოროთ მომხმარებლის-აგენტის ურთიერთობა, როდესაც ის მოხდება. აგენტურ AI-ზე გადასვლა არის მომხმარებლის სისტემის ურთიერთობის ხელახალი განმარტება. ჩვენ აღარ ვქმნით ინსტრუმენტებს, რომლებიც უბრალოდ პასუხობენ ბრძანებებს; ჩვენ ვგეგმავთ პარტნიორებს, რომლებიც მოქმედებენ ჩვენი სახელით. ეს ცვლის დიზაინის იმპერატივს ეფექტურობიდან და გამოყენების სიმარტივიდან გამჭვირვალობამდე, პროგნოზირებადობამდე და კონტროლამდე. როდესაც AI-ს შეუძლია ფრენის დაჯავშნა ან აქციებით ვაჭრობა საბოლოო დაწკაპუნების გარეშე, მისი „პანდუსების“ და „გადასასვლელის“ დიზაინი გადამწყვეტი ხდება. ჩვენი პასუხისმგებლობაა დავრწმუნდეთ, რომ მომხმარებლებმა იგრძნონ თავი მძღოლის სავარძელში, მაშინაც კი, როცა საჭეს გადასცემს. ეს ახალი რეალობა ასევე ამაღლებს UX მკვლევარის როლს. ჩვენ ვხდებით მომხმარებლის ნდობის მცველები, ვთანამშრომლობთ ინჟინრებთან და პროდუქტის მენეჯერებთან, რათა განვსაზღვროთ და გამოვცადოთ აგენტის ავტონომიის დაცვა. მკვლევარების გარდა, ჩვენ ვხდებით მომხმარებლის კონტროლის, გამჭვირვალობისა და განვითარების პროცესში ეთიკური გარანტიების დამცველები. პრიმიტივების პრაქტიკულ კითხვებად თარგმნით და ყველაზე უარესი სცენარის სიმულირებით, ჩვენ შეგვიძლია ავაშენოთ ძლიერი და უსაფრთხო სისტემები. ამ სტატიაში აღწერილია აგენტური ხელოვნური ინტელექტის კვლევის „რა“ და „რატომ“. მან აჩვენა, რომ ჩვენი ტრადიციული ინსტრუმენტების ნაკრები არასაკმარისია და ჩვენ უნდა მივიღოთ ახალი, წინდახედული მეთოდოლოგიები. შემდეგი სტატია დაეყრდნობა ამ საფუძველს, უზრუნველყოფს დიზაინის სპეციფიკურ შაბლონებს და ორგანიზაციულ პრაქტიკებს, რომლებიც გამჭვირვალე ხდის აგენტის სარგებლობას მომხმარებლებისთვის, რაც უზრუნველყოფს, რომ მათ შეუძლიათ გამოიყენონ აგენტური AI-ს ძალა თავდაჯერებულად და კონტროლით. UX-ის მომავალი სისტემების სანდო გახადას ეხება. აგენტური AI-ის დამატებითი გაგებისთვის, შეგიძლიათ შეისწავლოთ შემდეგი რესურსები:

Google AI ბლოგი აგენტური AI-ზე Microsoft-ის კვლევა AI აგენტებზე

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free