ავტონომიური აგენტებისთვის დიზაინი წარმოადგენს უნიკალურ იმედგაცრუებას. ჩვენ გადავცემთ კომპლექსურ დავალებას AI-ს, ის ქრება 30 წამის განმავლობაში (ან 30 წუთის განმავლობაში) და შემდეგ ბრუნდება შედეგით. ჩვენ ვუყურებთ ეკრანს. იმუშავა? ჰალუცინაცია ჰქონდა? შეამოწმა შესაბამისობის მონაცემთა ბაზა თუ გამოტოვა ეს ნაბიჯი? ჩვენ ჩვეულებრივ ვპასუხობთ ამ შფოთვას ორი უკიდურესობიდან ერთით. ჩვენ ან ვინახავთ სისტემას შავ ყუთად, ვმალავთ ყველაფერს სიმარტივის შესანარჩუნებლად, ან პანიკაში ვართ და ვაწვდით მონაცემთა ნაგავსაყრელს, სტრიმინგს ყველა ჟურნალის ხაზს და API ზარს მომხმარებელს. არც ერთი მიდგომა პირდაპირ არ ეხება იმ ნიუანსს, რომელიც საჭიროა მომხმარებლებისთვის გამჭვირვალობის იდეალური დონის უზრუნველსაყოფად. შავი ყუთი მომხმარებლებს უძლურების გრძნობას უტოვებს. მონაცემთა ნაგავსაყრელი ქმნის შეტყობინებების სიბრმავეს, ანადგურებს ეფექტურობას, რომელსაც აგენტი დაპირდა. მომხმარებლები იგნორირებას უკეთებენ ინფორმაციის მუდმივ ნაკადს, სანამ რაღაც არ გაფუჭდება, რა დროსაც მათ არ აქვთ კონტექსტი მის გამოსასწორებლად. ჩვენ გვჭირდება ორგანიზებული გზა, რათა ვიპოვოთ წონასწორობა. ჩემს წინა სტატიაში, „აგენტური ხელოვნური ინტელექტის დიზაინი“, ჩვენ გადავხედეთ ინტერფეისის ელემენტებს, რომლებიც აყალიბებენ ნდობას, როგორიცაა ხელოვნური ინტელექტის წინასწარ განზრახული მოქმედების ჩვენება (განზრახვის გადახედვა) და მომხმარებლებს ვაძლევთ კონტროლს იმაზე, თუ რამდენს აკეთებს AI დამოუკიდებლად (Autonomy Dials). მაგრამ იმის ცოდნა, თუ რომელი ელემენტები გამოვიყენოთ, მხოლოდ გამოწვევის ნაწილია. დიზაინერებისთვის ყველაზე რთული კითხვაა იმის ცოდნა, როდის გამოიყენონ ისინი. როგორ იცით, რომელი კონკრეტული მომენტი 30-წამიანი სამუშაო ნაკადში მოითხოვს Intent Preview-ს და რომლის დამუშავება შესაძლებელია ჟურნალის მარტივი ჩანაწერით? ამ სტატიაში მოცემულია ამ კითხვაზე პასუხის გაცემის მეთოდი. ჩვენ გავივლით გადაწყვეტილების კვანძის აუდიტს. ეს პროცესი აიძულებს დიზაინერებს და ინჟინრებს იმავე ოთახში ასახონ ლოგიკა მომხმარებლის ინტერფეისში. თქვენ შეისწავლით, თუ როგორ უნდა მიუთითოთ ზუსტი მომენტები, რომ მომხმარებელს სჭირდება განახლება იმის შესახებ, თუ რას აკეთებს AI. ჩვენ ასევე გავაშუქებთ ზემოქმედების/რისკის მატრიცას, რომელიც დაგვეხმარება პრიორიტეტების განსაზღვრაში, რომელი გადაწყვეტილების კვანძების ჩვენება და ნებისმიერი ასოცირებული დიზაინის ნიმუში დაწყვილდეს ამ გადაწყვეტილებასთან. გამჭვირვალობის მომენტები: საქმის შესწავლის მაგალითი განვიხილოთ Meridian (არა ნამდვილი სახელი), სადაზღვევო კომპანია, რომელიც იყენებს აგენტურ AI-ს პირველადი შემთხვევის პრეტენზიების დასამუშავებლად. მომხმარებელი ატვირთავს ავტომობილის დაზიანების ფოტოებს და პოლიციის ანგარიშს. შემდეგ აგენტი ქრება ერთი წუთით, სანამ დაბრუნდება რისკის შეფასებით და შემოთავაზებული გადახდის დიაპაზონით. თავდაპირველად, Meridian-ის ინტერფეისი უბრალოდ აჩვენებდა სარჩელის სტატუსის გამოთვლას. მომხმარებლები იმედგაცრუებულნი იყვნენ. მათ წარადგინეს რამდენიმე დეტალური დოკუმენტი და გაურკვევლად თვლიდნენ, განიხილა თუ არა AI პოლიციის დასკვნა, რომელიც შეიცავდა შემამსუბუქებელ გარემოებებს. შავმა ყუთმა შექმნა უნდობლობა. ამის გამოსწორების მიზნით, საპროექტო ჯგუფმა ჩაატარა გადაწყვეტილების კვანძის აუდიტი. მათ აღმოაჩინეს, რომ AI შეასრულა სამი განსხვავებული, ალბათობაზე დაფუძნებული ნაბიჯი, ჩაშენებული მრავალი პატარა ნაბიჯი:
გამოსახულების ანალიზი აგენტმა შეადარა დაზიანების ფოტოები ტიპიური ავტოავარიის სცენარების მონაცემთა ბაზას რემონტის ღირებულების შესაფასებლად. ეს მოიცავდა ნდობის ქულას. ტექსტური მიმოხილვა მან დაასკანირა პოლიციის ანგარიში საკვანძო სიტყვებისთვის, რომლებიც გავლენას ახდენენ პასუხისმგებლობაზე (მაგ., ხარვეზი, ამინდის პირობები, სიფხიზლე). ეს მოიცავდა სამართლებრივი მდგომარეობის ალბათობის შეფასებას. Policy Cross Reference ის ემთხვეოდა პრეტენზიის დეტალებს მომხმარებლის პოლიტიკის კონკრეტულ პირობებთან, გამონაკლისების ან დაფარვის ლიმიტების ძიებაში. ეს ასევე მოიცავდა ალბათურ შესატყვისს.
გუნდმა ეს ნაბიჯები გამჭვირვალობის მომენტებად აქცია. ინტერფეისის თანმიმდევრობა განახლდა:
დაზიანების ფოტოების შეფასება: ავტომობილის 500 შეჯახების პროფილთან შედარება. პოლიციის ანგარიშის განხილვა: პასუხისმგებლობის საკვანძო სიტყვებისა და სამართლებრივი პრეცედენტის ანალიზი. პოლიტიკის დაფარვის შემოწმება: თქვენს გეგმაში კონკრეტული გამონაკლისების შემოწმება.
სისტემას კვლავ იგივე დრო დასჭირდა, მაგრამ აგენტის შიდა მუშაობის შესახებ აშკარა კომუნიკაციამ აღადგინა მომხმარებლის ნდობა. მომხმარებლებს ესმოდათ, რომ ხელოვნური ინტელექტი ასრულებდა იმ რთულ დავალებას, რისთვისაც ის იყო შექმნილი და ზუსტად იცოდნენ, სად უნდა გაემახვილებინათ ყურადღება, თუ საბოლოო შეფასება არაზუსტი ჩანდა. დიზაინის ამ არჩევანმა შფოთვის მომენტი მომხმარებელთან კავშირის მომენტად აქცია. ზემოქმედების/რისკის მატრიცის გამოყენება: რისი დამალვა ავირჩიეთ AI გამოცდილების უმეტესობას არ აქვს მოვლენების და გადაწყვეტილების კვანძების დეფიციტი, რომლებიც პოტენციურად შეიძლება გამოჩნდეს დამუშავების დროს. აუდიტის ერთ-ერთი ყველაზე კრიტიკული შედეგი იყო იმის გადაწყვეტა, თუ რა უნდა დარჩეს უხილავი. Meridian-ის მაგალითში, backend-ის ჟურნალები ქმნიდნენ 50+ მოვლენას თითო პრეტენზიაზე. ჩვენ შეგვეძლო ნაგულისხმევად გვეჩვენებინა თითოეული მოვლენა, რადგან ისინი მუშავდებოდა როგორც UI-ს ნაწილი. ამის ნაცვლად, ჩვენ გამოვიყენეთ რისკის მატრიცა მათ დასაჭრელად:
ღონისძიების ჟურნალი: სერვერის პინგირებაWest-2 ზედმეტობის შემოწმებისთვის. ფილტრის ვერდიქტი: დამალვა. (დაბალი ფსონები, მაღალი ტექნიკურობა).
ღონისძიების ჟურნალი: სარემონტო შეფასების შედარება BlueBook ღირებულებასთან. ფილტრის ვერდიქტი: ჩვენება. (მაღალი ფსონები, გავლენას ახდენს მომხმარებლის გადახდაზე).
არასაჭირო დეტალების ამოჭრით, მნიშვნელოვანი ინფორმაცია - როგორიცაა დაფარვის გადამოწმება - უფრო გავლენიანი იყო. ჩვენ შევქმენით ღია ინტერფეისი და შევქმენით ღია გამოცდილება. ეს მიდგომა იყენებს იმ აზრს, რომ ადამიანები თავს უკეთ გრძნობენ სერვისის მიმართ, როდესაც ხედავენ შესრულებულ სამუშაოს. კონკრეტული ნაბიჯების ჩვენებით (შეფასება, განხილვა, გადამოწმება), ჩვენ შევცვალეთ 30 წამიანი ლოდინი შფოთვის დროიდან („გატეხილია?“) დროზე, თითქოს რაღაც ღირებული იქმნება („ფიქრობს“). მოდით ახლა უფრო დეტალურად განვიხილოთ, თუ როგორ შეგვიძლია გადავხედოთ გადაწყვეტილების მიღების პროცესს ჩვენს პროდუქტებში, რათა განვსაზღვროთ ძირითადი მომენტები, რომლებიც საჭიროებენ მკაფიო ინფორმაციას. გადაწყვეტილების კვანძის აუდიტი გამჭვირვალობა ვერ ხერხდება, როდესაც მას განვიხილავთ როგორც სტილის არჩევანს და არა ფუნქციურ მოთხოვნას. ჩვენ გვაქვს ტენდენცია ვიკითხოთ: "როგორი უნდა გამოიყურებოდეს UI?" სანამ ჩვენ ვიკითხავთ: "რას წყვეტს აგენტი სინამდვილეში?" გადაწყვეტილების კვანძის აუდიტი არის მარტივი გზა ხელოვნური ინტელექტის სისტემების გასაადვილებლად. ის მუშაობს სისტემის შიდა პროცესის გულდასმით შედგენით. მთავარი მიზანია იპოვოთ და მკაფიოდ განისაზღვროს ზუსტი მომენტები, როდესაც სისტემა წყვეტს დადგენილ წესებს და ამის ნაცვლად აკეთებს არჩევანს შემთხვევითობის ან შეფასების საფუძველზე. ამ სტრუქტურის რუკების შედგენით, შემქმნელებს შეუძლიათ აჩვენონ ეს გაურკვევლობის წერტილები უშუალოდ იმ ადამიანებს, რომლებიც იყენებენ სისტემას. ეს ცვლის სისტემის განახლებებს ბუნდოვანი განცხადებებიდან კონკრეტულ, სანდო ანგარიშებამდე იმის შესახებ, თუ როგორ მიაღწია AI დასკვნას. გარდა ზემოთ მოყვანილი სადაზღვევო შემთხვევის შესწავლისა, მე ახლახან ვმუშაობდი შესყიდვების აგენტის მშენებელ გუნდთან. სისტემამ განიხილა გამყიდველის კონტრაქტები და მონიშნული რისკები. თავდაპირველად, ეკრანზე ნაჩვენები იყო პროგრესის მარტივი ზოლი: „კონტრაქტების განხილვა“. მომხმარებლებს სძულდათ. ჩვენმა კვლევამ აჩვენა, რომ ისინი წუხდნენ დაკარგული მუხლის სამართლებრივი შედეგების შესახებ. ჩვენ დავაფიქსირეთ ეს გადაწყვეტილების კვანძის აუდიტის ჩატარებით. ამ სტატიის დასასრულს ამ აუდიტის ჩატარების ნაბიჯ-ნაბიჯ სია შევიტანე. ჩვენ ჩავატარეთ სესია ინჟინრებთან და ავღნიშნეთ, თუ როგორ მუშაობს სისტემა. ჩვენ დავადგინეთ „გადაწყვეტილების პუნქტები“ - მომენტები, როდესაც AI-ს უნდა გაერჩია ორი კარგი ვარიანტი. სტანდარტულ კომპიუტერულ პროგრამებში პროცესი ნათელია: თუ A მოხდა, მაშინ B ყოველთვის მოხდება. ხელოვნური ინტელექტის სისტემებში პროცესი ხშირად ეფუძნება შემთხვევითობას. AI ფიქრობს, რომ A არის ალბათ საუკეთესო არჩევანი, მაგრამ ეს შეიძლება იყოს მხოლოდ 65% დარწმუნებული. კონტრაქტის სისტემაში აღმოვაჩინეთ მომენტი, როდესაც AI შეამოწმა პასუხისმგებლობის პირობები ჩვენი კომპანიის წესების შესაბამისად. იშვიათად იყო იდეალური მატჩი. AI-ს უნდა გადაეწყვიტა, საკმარისი იყო თუ არა 90%-იანი მატჩი. ეს იყო გადაწყვეტილების მთავარი წერტილი.
მას შემდეგ რაც ამ კვანძის იდენტიფიცირება მოვახდინეთ, ჩვენ მას გავუმხილეთ მომხმარებლის წინაშე. „კონტრაქტების გადახედვის“ ნაცვლად, ინტერფეისი განახლდა შემდეგი სიტყვებით: „პასუხისმგებლობის პუნქტი განსხვავდება სტანდარტული შაბლონიდან. რისკის დონის ანალიზი“. ამ კონკრეტულმა განახლებამ მომხმარებლებს ნდობა შესძინა. მათ იცოდნენ, რომ აგენტმა შეამოწმა პასუხისმგებლობის პუნქტი. მათ გაიგეს დაგვიანების მიზეზი და მოიპოვეს ნდობა, რომ სასურველი მოქმედება უკანა მხარეს ხდებოდა. მათ ასევე იცოდნენ, სად უნდა ჩაეღრმავებინათ, როგორც კი აგენტმა მოახდინა კონტრაქტი. იმის შესამოწმებლად, თუ როგორ იღებს AI გადაწყვეტილებებს, თქვენ მჭიდროდ უნდა იმუშაოთ თქვენს ინჟინრებთან, პროდუქტის მენეჯერებთან, ბიზნეს ანალიტიკოსებთან და მთავარ ადამიანებთან, რომლებიც აკეთებენ არჩევანს (ხშირად ფარულად), რაც გავლენას ახდენს AI ინსტრუმენტის ფუნქციონირებაზე. დახაზეთ ის ნაბიჯები, რომელსაც ინსტრუმენტი გადადგამს. მონიშნეთ ყველა ადგილი, სადაც პროცესი იცვლის მიმართულებას, რადგან დაკმაყოფილებულია ალბათობა. ეს ის ადგილებია, სადაც ყურადღება უნდა გაამახვილოთ იმაზე, რომ იყოთ უფრო გამჭვირვალე. როგორც ნაჩვენებია სურათზე 2 ქვემოთ, გადაწყვეტილების კვანძის აუდიტი მოიცავს შემდეგ ნაბიჯებს:
შეკრიბეთ გუნდი: შემოიტანეთ პროდუქტის მფლობელები, ბიზნეს ანალიტიკოსები, დიზაინერები, ძირითადი გადაწყვეტილების მიმღები პირები და ინჟინრები, რომლებმაც შექმნეს AI. მაგალითად, იფიქრეთ პროდუქტის გუნდზე, რომელიც აშენებს AI ხელსაწყოს, რომელიც შექმნილია ბინძური იურიდიული კონტრაქტების გადახედვისთვის. გუნდში შედის UX დიზაინერი, პროდუქტის მენეჯერი, UX მკვლევარი, პრაქტიკოსი იურისტი, რომელიც მოქმედებს როგორც საგნის ექსპერტი, და ბექენდის ინჟინერი, რომელმაც დაწერა ტექსტის ანალიზის კოდი.
დახაზეთ მთელი პროცესი: დააფიქსირეთ ყოველი ნაბიჯი, რომელსაც AI გადადგამს, მომხმარებლის პირველი მოქმედებიდან საბოლოო შედეგამდე. გუნდი დგას დაფასთან და ასახავს მთელ თანმიმდევრობას ძირითადი სამუშაო პროცესისთვის, რომელიც მოიცავს AI-ს კომპლექსურ ხელშეკრულებაში პასუხისმგებლობის პუნქტის ძიებას. ადვოკატი ატვირთავსორმოცდაათგვერდიანი PDF → სისტემა გარდაქმნის დოკუმენტს წასაკითხად ტექსტად. → AI სკანირებს გვერდებს პასუხისმგებლობის დებულებებისთვის. → მომხმარებელი ელოდება. → წამების ან წუთების შემდეგ ინსტრუმენტი ხაზს უსვამს ნაპოვნი აბზაცებს მომხმარებლის ინტერფეისზე ყვითლად. ისინი ამას აკეთებენ მრავალი სხვა სამუშაო პროცესისთვის, რომლებსაც ინსტრუმენტი ასევე ათავსებს.
იპოვეთ, სად არის გაურკვეველი: შეხედეთ პროცესის რუკას ნებისმიერი ადგილისთვის, სადაც AI ადარებს ვარიანტებს ან შეყვანებს, რომლებსაც არ აქვთ ერთი სრულყოფილი შესატყვისი. გუნდი ათვალიერებს დაფას, რათა შეამჩნიოს ორაზროვანი ნაბიჯები. სურათის ტექსტად გადაქცევა მკაცრი წესების მიხედვით ხდება. კონკრეტული პასუხისმგებლობის პუნქტის პოვნა გულისხმობს გამოცნობას. ყველა ფირმა ამ პუნქტებს განსხვავებულად წერს, ამიტომ AI-ს უნდა აწონ-დაწონოს მრავალი ვარიანტი და გააკეთოს პროგნოზი ზუსტი სიტყვების შესატყვისის ნაცვლად.
განსაზღვრეთ „საუკეთესო გამოცნობის“ საფეხურები: ყოველი გაურკვეველი ადგილისთვის შეამოწმეთ, იყენებს თუ არა სისტემა ნდობის ქულას (მაგალითად, არის თუ არა 85% დარწმუნებული?). ეს ის წერტილებია, სადაც AI აკეთებს საბოლოო არჩევანს. სისტემამ უნდა გამოიცნოს (დასცეს ალბათობა) რომელი აბზაც(ებ)ი ჰგავს სტანდარტულ ვალდებულების დებულებას. იგი ანიჭებს ნდობის ქულას მის საუკეთესო გამოცნობას. ეს ვარაუდი არის გადაწყვეტილების კვანძი. ინტერფეისმა უნდა აცნობოს ადვოკატს, რომ ხაზს უსვამს პოტენციურ შესატყვისს, ვიდრე თქვას, რომ მან იპოვა საბოლოო პუნქტი.
შეამოწმეთ არჩევანი: თითოეული არჩევანის პუნქტისთვის გამოთვალეთ კონკრეტული შიდა მათემატიკა ან შედარება (მაგ., კონტრაქტის ნაწილის შესაბამისობა პოლიტიკასთან ან გატეხილი მანქანის სურათის შედარება დაზიანებული მანქანის ფოტოების ბიბლიოთეკასთან). ინჟინერი განმარტავს, რომ სისტემა ადარებს სხვადასხვა პარაგრაფებს წარსული ფირმის საქმეების სტანდარტული პასუხისმგებლობის დებულებების მონაცემთა ბაზასთან. ის ითვლის ტექსტის მსგავსების ქულას, რათა გადაწყვიტოს მატჩი ალბათობების საფუძველზე.
დაწერეთ მკაფიო ახსნა-განმარტებები: შექმენით მომხმარებლისთვის შეტყობინებები, რომლებიც ნათლად აღწერს კონკრეტულ შიდა მოქმედებას, რომელიც ხდება მაშინ, როდესაც AI აკეთებს არჩევანს. კონტენტის დიზაინერი წერს კონკრეტულ შეტყობინებას ზუსტად ამ მომენტისთვის. ტექსტში ვკითხულობთ: დოკუმენტის ტექსტის შედარება სტანდარტულ ფირმის დებულებებთან პოტენციური ვალდებულების რისკების გამოსავლენად.
განაახლეთ ეკრანი: განათავსეთ ეს ახალი, მკაფიო ახსნა-განმარტებები მომხმარებლის ინტერფეისში, ჩაანაცვლეთ ბუნდოვანი შეტყობინებები, როგორიცაა „კონტრაქტების განხილვა“. დიზაინის გუნდი შლის ზოგად დამუშავების PDF ჩატვირთვის სპინერს. ისინი ათავსებენ ახალ ახსნას სტატუსის ზოლში, რომელიც მდებარეობს დოკუმენტის მნახველის ზემოთ, სანამ AI ფიქრობს.
შეამოწმეთ ნდობა: დარწმუნდით, რომ ეკრანის ახალი შეტყობინებები აძლევს მომხმარებლებს მარტივ მიზეზს ნებისმიერი ლოდინის დროის ან შედეგისთვის, რაც მათ უფრო თავდაჯერებულად და ნდობად უნდა აგრძნობინოს.
ზემოქმედების/რისკის მატრიცა მას შემდეგ რაც კარგად დააკვირდებით ხელოვნური ინტელექტის პროცესს, სავარაუდოდ ნახავთ ბევრ წერტილს, სადაც ის აკეთებს არჩევანს. AI-ს შეუძლია გააკეთოს ათობით მცირე არჩევანი ერთი რთული ამოცანისთვის. ყველა მათგანის ჩვენება ქმნის ძალიან ბევრ არასაჭირო ინფორმაციას. თქვენ უნდა დააჯგუფოთ ეს არჩევანი. თქვენ შეგიძლიათ გამოიყენოთ ზემოქმედების/რისკის მატრიცა ამ არჩევანის დასალაგებლად იმ ქმედებ(ებ)ის მიხედვით, რომელსაც AI აკეთებს. აქ მოცემულია ზემოქმედების/რისკის მატრიცების მაგალითები: უპირველეს ყოვლისა, მოძებნეთ დაბალი ფსონების და დაბალი ზემოქმედების გადაწყვეტილებები. დაბალი ფსონები / დაბალი გავლენა
მაგალითი: ფაილის სტრუქტურის ორგანიზება ან დოკუმენტის სახელის გადარქმევა. გამჭვირვალობის საჭიროება: მინიმალური. დახვეწილი სადღეგრძელო შეტყობინება ან ჟურნალის ჩანაწერი საკმარისია. მომხმარებლებს შეუძლიათ მარტივად გააუქმონ ეს ქმედებები.
შემდეგ იდენტიფიცირება მაღალი ფსონების და მაღალი გავლენის მქონე გადაწყვეტილებების შესახებ. მაღალი ფსონები / მაღალი გავლენა
მაგალითი: სესხის განაცხადის უარყოფა ან საფონდო ვაჭრობის განხორციელება. გამჭვირვალობის საჭიროება: მაღალი. ეს ქმედებები მოითხოვს სამუშაოს მტკიცებულებას. სისტემამ უნდა აჩვენოს დასაბუთება მოქმედებამდე ან დაუყოვნებლივ.
განვიხილოთ ფინანსური სავაჭრო ბოტი, რომელიც ყველა ყიდვა/გაყიდვის შეკვეთას ერთნაირად ეპყრობა. ის ახორციელებს $5 ვაჭრობას იგივე გამჭვირვალობით, როგორც $50,000 ვაჭრობა. მომხმარებლებმა შეიძლება ეჭვქვეშ დააყენონ, აღიარებს თუ არა ინსტრუმენტი გამჭვირვალობის პოტენციურ გავლენას დიდ დოლარზე ვაჭრობაზე. მათ სჭირდებათ, რომ სისტემა შეაჩეროს და აჩვენოს თავისი მუშაობა მაღალი ფსონების გარიგებებისთვის. გამოსავალი არის განხილვის ლოგიკური მდგომარეობის შემოღება ნებისმიერი ტრანზაქციისთვის, რომელიც აღემატება კონკრეტულ დოლარს, რაც მომხმარებელს საშუალებას აძლევს დაინახოს გადაწყვეტილების განმახორციელებელი ფაქტორები შესრულებამდე. კვანძების დახატვა შაბლონებზე: დიზაინის ნიმუშის შერჩევის რუბრიკა მას შემდეგ რაც დაადგინეთ თქვენი გამოცდილების ძირითადი გადაწყვეტილების კვანძები, უნდა გადაწყვიტოთ, რომელი UI ნიმუში ვრცელდება თითოეულ მათგანზე, რომელსაც თქვენ აჩვენებთ. აგენტური ხელოვნური ინტელექტის დიზაინში, ჩვენ შემოვიღეთ ისეთი შაბლონები, როგორიცაა Intent Preview (მაღალი ფსონების კონტროლისთვის) და Action Audit (რეტროსპექტული უსაფრთხოებისთვის). მათ შორის არჩევის გადამწყვეტი ფაქტორი შექცევადობაა. ჩვენ ვფილტრავთ თითოეულსგადაწყვეტილების კვანძი გავლენის მატრიცის მეშვეობით სწორი ნიმუშის მინიჭების მიზნით: მაღალი ფსონები და შეუქცევადი: ეს კვანძები საჭიროებენ განზრახვის გადახედვას. იმის გამო, რომ მომხმარებელს არ შეუძლია ადვილად გააუქმოს მოქმედება (მაგ. მონაცემთა ბაზის სამუდამოდ წაშლა), გამჭვირვალობის მომენტი უნდა მოხდეს შესრულებამდე. სისტემამ უნდა შეაჩეროს, განმარტოს თავისი განზრახვა და მოითხოვოს დადასტურება. მაღალი ფსონები და შექცევადი: ამ კვანძებს შეუძლიათ დაეყრდნონ Action Audit & Undo შაბლონს. თუ AI-ზე მომუშავე გაყიდვების აგენტი გადაიტანს ტყვიას სხვა მილსადენში, მას შეუძლია ამის გაკეთება დამოუკიდებლად, სანამ ის აცნობებს მომხმარებელს და შესთავაზებს დაუყოვნებლივ გაუქმების ღილაკს. კვანძების ამ გზით მკაცრად კატეგორიზაციის გზით, ჩვენ თავიდან ავიცილებთ "გაფრთხილებულ დაღლილობას". ჩვენ ვიტოვებთ მაღალი ხახუნის განზრახვის წინასწარ გადახედვას მხოლოდ ჭეშმარიტად შეუქცევადი მომენტებისთვის, ხოლო ვეყრდნობით Action Audit-ს, რათა შევინარჩუნოთ სიჩქარე სხვა ყველაფერში.
შექცევადი შეუქცევადია დაბალი ზემოქმედება ტიპი: Auto-ExecuteUI: Passive Toast / LogEx: ფაილის გადარქმევა ტიპი: ConfirmUI: მარტივი გაუქმების ვარიანტიEx: ელფოსტის არქივირება მაღალი ზემოქმედება ტიპი: ReviewUI: შეტყობინება + მიმოხილვა TrailEx: მონახაზის გაგზავნა კლიენტისთვის ტიპი: Intent previewUI: Modal / Explicit PermissionEx: სერვერის წაშლა
ცხრილი 1: ზემოქმედების და შექცევადობის მატრიცა შეიძლება გამოყენებულ იქნას თქვენი გამჭვირვალობის მომენტების დიზაინის ნიმუშებზე გამოსახულების მიზნით. ხარისხობრივი დადასტურება: "მოიცადე, რატომ?" ტესტი თქვენ შეგიძლიათ იდენტიფიციროთ პოტენციური კვანძები დაფაზე, მაგრამ თქვენ უნდა დაადასტუროთ ისინი ადამიანის ქცევით. თქვენ უნდა შეამოწმოთ შეესაბამება თუ არა თქვენი რუკა მომხმარებლის მენტალურ მოდელს. მე ვიყენებ პროტოკოლს სახელწოდებით "მოიცადე, რატომ?" ტესტი. სთხოვეთ მომხმარებელს უყუროს აგენტის დავალებას. დაავალეთ მათ ხმამაღლა საუბარი. როდესაც ისინი სვამენ კითხვას: "მოიცადე, რატომ გააკეთა ეს?" ან "გაჭედილია?" ან "გამიგონა?" - თქვენ მონიშნეთ დროის ანაბეჭდი. ეს კითხვები მიუთითებს მომხმარებლის დაბნეულობაზე. მომხმარებელი გრძნობს, რომ მათი კონტროლი შორდება. მაგალითად, ჯანდაცვის დაგეგმვის ასისტენტისთვის ჩატარებულ კვლევაში, მომხმარებლები უყურებდნენ აგენტს, რომელიც დაჯავშნა შეხვედრაზე. ეკრანი სტატიკური იყო ოთხი წამის განმავლობაში. მონაწილეები მუდმივად სვამდნენ კითხვას: „ჩემს კალენდარს ამოწმებს თუ ექიმის?“
ამ კითხვამ გამოავლინა გამჭვირვალობის დაკარგული მომენტი. სისტემას სჭირდებოდა ეს ოთხწამიანი ლოდინის ორ განსხვავებულ ეტაპად გაყოფა: „თქვენი ხელმისაწვდომობის შემოწმება“, რასაც მოჰყვება „სინქრონიზაცია პროვაიდერთან განრიგთან“. ამ მცირე ცვლილებამ შეამცირა მომხმარებლების გამოხატული შფოთვის დონე. გამჭვირვალობა ვერ ხერხდება, როდესაც ის აღწერს მხოლოდ სისტემის მოქმედებას. ინტერფეისმა უნდა დააკავშიროს ტექნიკური პროცესი მომხმარებლის კონკრეტულ მიზანთან. ეკრანი, რომელშიც ნაჩვენებია „თქვენი ხელმისაწვდომობის შემოწმება“ იშლება, რადგან მას არ აქვს კონტექსტი. მომხმარებელს ესმის, რომ AI უყურებს კალენდარს, მაგრამ მათ არ იციან რატომ. ჩვენ უნდა დავაწყვილოთ მოქმედება შედეგთან. სისტემამ უნდა დაყოს ეს ოთხი წამიანი ლოდინი ორ განსხვავებულ ნაბიჯად. პირველ რიგში, ინტერფეისი აჩვენებს "თქვენი კალენდრის შემოწმება ღია დროის საპოვნელად". შემდეგ ის განახლდება „პროვაიდერის განრიგთან სინქრონიზაცია თქვენი შეხვედრის უზრუნველსაყოფად“. ეს აფუძნებს ტექნიკურ პროცესს მომხმარებლის რეალურ ცხოვრებაში. განვიხილოთ AI-ის მართვის ინვენტარი ადგილობრივი კაფესთვის. სისტემა აწყდება მიწოდების დეფიციტს. ინტერფეისი, რომელიც კითხულობს „მიმწოდებლის კონტაქტს“ ან „პარამეტრების განხილვას“ ქმნის შფოთვას. მენეჯერს აინტერესებს, სისტემა აუქმებს შეკვეთას ან ყიდულობს ძვირადღირებულ ალტერნატივას. უკეთესი მიდგომაა განზრახული შედეგის ახსნა: „ალტერნატიული მომწოდებლების შეფასება თქვენი პარასკევის მიწოდების გრაფიკის შესანარჩუნებლად“. ეს ეუბნება მომხმარებელს ზუსტად რის მიღწევას ცდილობს AI. აუდიტის ფუნქციონირება თქვენ დაასრულეთ გადაწყვეტილების კვანძის აუდიტი და გაფილტრეთ თქვენი სია ზემოქმედებისა და რისკის მატრიცის მეშვეობით. ახლა თქვენ გაქვთ გამჭვირვალობისთვის აუცილებელი მომენტების სია. შემდეგი, თქვენ უნდა შექმნათ ისინი UI-ში. ეს ნაბიჯი მოითხოვს გუნდურ მუშაობას სხვადასხვა დეპარტამენტში. თქვენ არ შეგიძლიათ დამოუკიდებლად შექმნათ გამჭვირვალობა დიზაინის ხელსაწყოს გამოყენებით. თქვენ უნდა გესმოდეთ, როგორ მუშაობს სისტემა კულისებში. დაიწყეთ ლოგიკური მიმოხილვით. შეხვდით თქვენი წამყვანი სისტემის დიზაინერს. მოიტანეთ გადაწყვეტილების კვანძების თქვენი რუკა. თქვენ უნდა დაადასტუროთ, რომ სისტემას რეალურად შეუძლია ამ მდგომარეობების გაზიარება. ხშირად ვხვდები, რომ ტექნიკური სისტემა არ ავლენს ზუსტ მდგომარეობას, რომლის ჩვენებაც მინდა. ინჟინერმა შეიძლება თქვას, რომ სისტემა უბრალოდ უბრუნებს ზოგად „მუშა“ სტატუსს. თქვენ უნდა იმოქმედოთ დეტალური განახლებისთვის. თქვენ გჭირდებათ სისტემა კონკრეტული შეტყობინების გასაგზავნადროცა ტექსტის წაკითხვიდან გადადის შემოწმების წესებზე. ამ ტექნიკური კავშირის გარეშე, თქვენი დიზაინის აშენება შეუძლებელია. შემდეგი, ჩართეთ კონტენტის დიზაინის გუნდი. თქვენ გაქვთ ხელოვნური ინტელექტის მოქმედების ტექნიკური მიზეზი, მაგრამ გჭირდებათ მკაფიო, ადამიანური ახსნა. ინჟინრები უზრუნველყოფენ ძირითად პროცესს, მაგრამ შინაარსის დიზაინერები უზრუნველყოფენ მის კომუნიკაციას. მარტო არ დაწეროთ ეს შეტყობინებები. დეველოპერმა შეიძლება დაწეროს „ფუნქციის შესრულება 402“, რაც ტექნიკურად სწორია, მაგრამ მომხმარებლისთვის უაზრო. დიზაინერმა შეიძლება დაწეროს "ფიქრი", რომელიც მეგობრული, მაგრამ ძალიან ბუნდოვანია. შინაარსის სტრატეგი პოულობს სწორ შუა ადგილს. ისინი ქმნიან კონკრეტულ ფრაზებს, როგორიცაა „პასუხისმგებლობის რისკების სკანირება“, რომელიც აჩვენებს, რომ AI მუშაობს მომხმარებლის დაბნევის გარეშე. და ბოლოს, შეამოწმეთ თქვენი შეტყობინებების გამჭვირვალობა. არ დაელოდოთ საბოლოო პროდუქტის შექმნას, რათა ნახოთ, მუშაობს თუ არა ტექსტი. მე ვატარებ შედარებით ტესტებს მარტივ პროტოტიპებზე, სადაც ერთადერთი რაც იცვლება არის სტატუსის შეტყობინება. მაგალითად, მე ვაჩვენებ ერთ ჯგუფს (A ჯგუფს) შეტყობინებას, რომელშიც ნათქვამია „იდენტურობის გადამოწმება“ და მეორე ჯგუფს (B ჯგუფი) შეტყობინებას, რომელიც ამბობს „სახელმწიფო მონაცემთა ბაზის შემოწმება“ (ეს არის მოგონილი მაგალითები, მაგრამ თქვენ გესმით აზრი). შემდეგ მათ ვეკითხები, რომელი AI გრძნობს თავს უფრო უსაფრთხოდ. ხშირად აღმოაჩენთ, რომ ზოგიერთი სიტყვა იწვევს შეშფოთებას, ზოგი კი ნდობას ამყარებს. თქვენ უნდა განიხილოთ ფორმულირება, როგორც ის, რაც გჭირდებათ შესამოწმებლად და ეფექტურობის დასამტკიცებლად. როგორ ცვლის ეს დიზაინის პროცესს ამ აუდიტის ჩატარებას აქვს პოტენციალი გააძლიეროს გუნდის ერთად მუშაობა. ჩვენ ვწყვეტთ გაპრიალებული დიზაინის ფაილების გადაცემას. ჩვენ ვიწყებთ ბინძური პროტოტიპების და გაზიარებული ცხრილების გამოყენებას. ძირითადი ინსტრუმენტი ხდება გამჭვირვალობის მატრიცა. ინჟინრები და კონტენტის დიზაინერები ერთად არედაქტირებენ ამ ცხრილს. ისინი ასახავს ზუსტ ტექნიკურ კოდებს იმ სიტყვებზე, რომლებსაც მომხმარებელი წაიკითხავს. ლოგიკური განხილვის დროს გუნდები განიცდიან ხახუნს. წარმოიდგინეთ, რომ დიზაინერი ეკითხება ინჟინერს, თუ როგორ გადაწყვეტს AI უარი თქვას ხარჯების ანგარიშზე წარდგენილ ტრანზაქციაზე. ინჟინერმა შეიძლება თქვას, რომ backend გამოსცემს მხოლოდ ზოგადი სტატუსის კოდს, როგორიცაა "შეცდომა: დაკარგული მონაცემები". დიზაინერი აცხადებს, რომ ეს არ არის მოქმედი ინფორმაცია ეკრანზე. დიზაინერი აწარმოებს მოლაპარაკებას ინჟინერთან კონკრეტული ტექნიკური კაკლის შესაქმნელად. ინჟინერი წერს ახალ წესს, რათა სისტემა აცნობებს ზუსტად იმას, რაც აკლია, მაგალითად, დაკარგული ქვითრის სურათს. კონტენტის დიზაინერები მოქმედებენ როგორც მთარგმნელები ამ ფაზაში. დეველოპერმა შეიძლება დაწეროს ტექნიკურად ზუსტი სტრიქონი, როგორიცაა „გაანგარიშება ნდობის ბარიერი გამყიდველის შესატყვისისთვის“. კონტენტის დიზაინერი თარგმნის ამ სტრიქონს ფრაზად, რომელიც აყალიბებს ნდობას კონკრეტული შედეგისთვის. სტრატეგი გადაწერს მას, როგორც "ადგილობრივი გამყიდველის ფასების შედარება თქვენი პარასკევის მიწოდების უზრუნველსაყოფად". მომხმარებელს ესმის მოქმედება და შედეგი. მთელი ჯვარედინი ფუნქციური გუნდი ზის მომხმარებლის ტესტირების სესიებზე. ისინი უყურებენ რეალური ადამიანის რეაქციას სხვადასხვა სტატუსის შეტყობინებებზე. მომხმარებლის პანიკის დანახვა, რადგან ეკრანზე ნათქვამია „ვაჭრობის განხორციელება“ აიძულებს გუნდს გადახედოს მიდგომას. ინჟინრები და დიზაინერები უკეთეს ფორმულირებას უერთდებიან. აქციების შეძენამდე ისინი ტექსტს ცვლიან „საკმარისი თანხების გადამოწმებით“. ერთობლივი ტესტირება გარანტიას იძლევა, რომ საბოლოო ინტერფეისი ემსახურება როგორც სისტემის ლოგიკას, ასევე მომხმარებლის სიმშვიდეს. დრო სჭირდება ამ დამატებითი აქტივობების გუნდის კალენდარში ჩართვას. თუმცა, საბოლოო შედეგი უნდა იყოს გუნდი, რომელიც უფრო ღიად დაუკავშირდება და მომხმარებლებს, რომლებსაც უკეთ ესმით, რას აკეთებენ მათი AI-ზე მომუშავე ინსტრუმენტები მათი სახელით (და რატომ). ეს ინტეგრირებული მიდგომა არის ჭეშმარიტად სანდო AI გამოცდილების შემუშავების ქვაკუთხედი. ნდობა დიზაინის არჩევანია ჩვენ ხშირად ვუყურებთ ნდობას, როგორც მომხმარებლის კარგი გამოცდილების ემოციურ ქვეპროდუქტს. უფრო ადვილია ნდობის განხილვა, როგორც პროგნოზირებადი კომუნიკაციის მექანიკური შედეგი. ჩვენ ვამყარებთ ნდობას სწორ დროს სწორი ინფორმაციის ჩვენებით. ჩვენ მას ვანადგურებთ მომხმარებლის გადატვირთვით ან ტექნიკის სრულად დამალვით. დაიწყეთ გადაწყვეტილების კვანძის აუდიტით, განსაკუთრებით აგენტური AI ინსტრუმენტებისა და პროდუქტებისთვის. იპოვეთ მომენტები, როდესაც სისტემა აკეთებს განსჯას. შეადგინეთ ეს მომენტები რისკის მატრიცაზე. თუ ფსონები მაღალია, გახსენით ყუთი. აჩვენე ნამუშევარი. შემდეგ სტატიაში ჩვენ განვიხილავთ, თუ როგორ უნდა შეიმუშაოთ ეს მომენტები: როგორ დავწეროთ ასლი, ააწყოთ ინტერფეისი და გავუმკლავდეთ გარდაუვალ შეცდომებს, როდესაც აგენტი არასწორად ხვდება. დანართი: გადაწყვეტილების კვანძის აუდიტის ჩამონათვალი ფაზა 1: დაყენება და რუქა ✅ შეკრიბეთ გუნდი: შემოიტანეთ პროდუქტის მფლობელები, ბიზნეს ანალიტიკოსები, დიზაინერები,ძირითადი გადაწყვეტილების მიმღებები და ინჟინრები, რომლებმაც ააშენეს AI. მინიშნება: თქვენ გჭირდებათ ინჟინრები, რომ ახსნან რეალური backend ლოგიკა. არ სცადოთ ეს ნაბიჯი მარტო. ✅ დახაზეთ მთელი პროცესი: დააფიქსირეთ ყველა ნაბიჯი, რომელსაც AI გადადგამს, მომხმარებლის პირველი მოქმედებიდან საბოლოო შედეგამდე. მინიშნება: ფიზიკური დაფის სესია ხშირად საუკეთესოდ მუშაობს ამ საწყისი ნაბიჯების შესასრულებლად. ფაზა 2: ფარული ლოგიკის პოვნა ✅ იპოვეთ, სად არის გაურკვეველი: შეხედეთ პროცესის რუკას ნებისმიერი ადგილისთვის, სადაც AI ადარებს ვარიანტებს ან შეყვანებს, რომლებსაც არ აქვთ ერთი სრულყოფილი შესატყვისი. ✅ გამოიცანი საუკეთესო გამოსაცნობი ნაბიჯები: თითოეული გაურკვეველი ადგილისთვის, შეამოწმეთ, იყენებს თუ არა სისტემა ნდობის ქულას. მაგალითად, იკითხეთ, არის თუ არა სისტემა 85 პროცენტით დარწმუნებული. ეს ის წერტილებია, სადაც AI აკეთებს საბოლოო არჩევანს. ✅ შეამოწმეთ არჩევანი: თითოეული არჩევანის პუნქტისთვის გამოთვალეთ კონკრეტული შიდა მათემატიკა ან შედარება. მაგალითად არის ხელშეკრულების ნაწილის პოლიტიკასთან შესაბამისობა. კიდევ ერთი მაგალითია გატეხილი მანქანის სურათის შედარება დაზიანებული მანქანის ფოტოების ბიბლიოთეკასთან. ფაზა 3: მომხმარებლის გამოცდილების შექმნა ✅ დაწერეთ მკაფიო ახსნა-განმარტებები: შექმენით მომხმარებლისთვის შეტყობინებები, რომლებიც ნათლად აღწერს კონკრეტულ შიდა მოქმედებას, რომელიც ხდება მაშინ, როდესაც AI აკეთებს არჩევანს. მინიშნება: დააფუძნეთ თქვენი გზავნილები კონკრეტულ რეალობაში. თუ AI დაჯავშნის კლიენტთან შეხვედრას ადგილობრივ კაფეში, უთხარით მომხმარებელს, რომ სისტემა ამოწმებს კაფეების დაჯავშნის სისტემას. ✅ განაახლეთ ეკრანი: განათავსეთ ეს ახალი, მკაფიო განმარტებები მომხმარებლის ინტერფეისში. შეცვალეთ ბუნდოვანი შეტყობინებები, როგორიცაა კონტრაქტების გადახედვა თქვენი კონკრეტული განმარტებებით. ✅ შეამოწმეთ ნდობა: დარწმუნდით, რომ ეკრანის ახალი შეტყობინებები მომხმარებლებს მარტივ მიზეზს აძლევს ლოდინის დროის ან შედეგისთვის. ამან მათ უნდა იგრძნონ თავდაჯერებულობა და ნდობა. მინიშნება: შეამოწმეთ ეს შეტყობინებები რეალურ მომხმარებლებთან, რათა დაადასტუროთ, რომ მათ ესმით მიღწეული კონკრეტული შედეგი.