Agentic AI mijozlar tajribasini va operatsion samaradorlikni o'zgartirishga tayyor, bu esa rahbariyatdan yangi strategik yondashuvni talab qiladi. Sun'iy intellektdagi bu evolyutsiya tizimlarga vazifalarni rejalashtirish, bajarish va qat'iylik bilan bajarish, oddiy tavsiyalardan tashqari faol harakatlarga o'tish imkonini beradi. UX guruhlari, mahsulot menejerlari va rahbarlar uchun bu siljishni tushunish innovatsiyalar imkoniyatlarini ochish, ish jarayonlarini tartibga solish va texnologiya odamlarga qanday xizmat qilishini qayta aniqlash uchun juda muhimdir. Agentic AI-ni Robotik jarayonlarni avtomatlashtirish (RPA) bilan chalkashtirib yuborish oson, bu texnologiya kompyuterlarda bajariladigan qoidalarga asoslangan vazifalarga qaratilgan. Farqi qat'iylik va fikrlashda. RPA qattiq skriptga amal qilishda zo'r: agar X sodir bo'lsa, Y qiling. U inson qo'llarini taqlid qiladi. Agentlik AI insonning fikrlashiga taqlid qiladi. U chiziqli skriptga amal qilmaydi; birini yaratadi. Ishga yollash ish jarayonini ko'rib chiqing. RPA boti rezyumeni skanerlashi va ma'lumotlar bazasiga yuklashi mumkin. U takrorlanadigan vazifani mukammal bajaradi. Agentlik tizimi rezyumeni ko'rib chiqadi, nomzodning ma'lum bir sertifikat ro'yxatini, yangi mijoz talabi bo'lgan o'zaro ma'lumotnomalarni ko'radi va ushbu moslikni ta'kidlab, shaxsiylashtirilgan elektron pochta loyihasini tuzishga qaror qiladi. RPA oldindan belgilangan rejani amalga oshiradi; Agent AI rejani maqsad asosida tuzadi. Ushbu avtonomiya agentlarni biz so'nggi o'n yil davomida ishlatgan bashoratli vositalardan ajratib turadi. Yana bir misol yig'ilish mojarolarini boshqarishdir. Taqvimingizga kiritilgan bashoratli model sizning uchrashuvlar jadvalingiz va hamkasblaringiz jadvallarini tahlil qilishi mumkin. Keyin u bir vaqtning o'zida rejalashtirilgan ikkita muhim uchrashuv yoki asosiy ishtirokchi ta'tilda bo'lganida rejalashtirilgan uchrashuv kabi potentsial mojarolarni taklif qilishi mumkin. U sizga ma'lumot beradi va yuzaga kelishi mumkin bo'lgan muammolarni ko'rsatadi, lekin siz harakat qilish uchun javobgarsiz. Agentlik AI, xuddi shu stsenariyda, faqat oldini olish uchun mojarolarni taklif qilishdan tashqariga chiqadi. Asosiy ishtirokchi bilan ziddiyatni aniqlagandan so'ng, agent quyidagi yo'llar bilan harakat qilishi mumkin:
Barcha kerakli ishtirokchilarning mavjudligini tekshirish. Hamma uchun mos keladigan muqobil vaqt oralig'ini aniqlash. Barcha ishtirokchilarga taklif qilingan yangi uchrashuv taklifnomalarini yuborish. Agar ziddiyat tashqi ishtirokchi bilan bo'lsa, agent boshqa vaqtni o'zgartirish zarurligini tushuntirib, muqobil vaqtlarni taklif qiluvchi elektron xat loyihasini ishlab chiqishi va yuborishi mumkin. Tasdiqlangandan so'ng taqvimingiz va hamkasblaringiz taqvimlarini yangi uchrashuv tafsilotlari bilan yangilash.
Ushbu agentlik AI maqsadni tushunadi (uchrashuv mojarosini hal qilish), qadamlarni rejalashtiradi (mavjudligini tekshirish, muqobil variantlarni topish, takliflarni yuborish), bu qadamlarni bajaradi va ziddiyat hal qilinmaguncha davom etadi, barchasi minimal to'g'ridan-to'g'ri foydalanuvchi aralashuvi bilan. Bu "agent" farqni ko'rsatadi: tizim foydalanuvchiga ma'lumot berishdan ko'ra, foydalanuvchi uchun faol qadamlar qo'yadi. Agentlik AI tizimlari maqsadni tushunadi, unga erishish uchun bir qator qadamlarni rejalashtiradi, bu qadamlarni bajaradi va hatto ish noto'g'ri bo'lsa, moslashadi. Buni faol raqamli yordamchi kabi tasavvur qiling. Asosiy texnologiya ko'pincha tushunish va fikr yuritish uchun katta til modellarini (LLM) murakkab vazifalarni boshqariladigan harakatlarga ajratuvchi rejalashtirish algoritmlari bilan birlashtiradi. Ushbu agentlar o'z maqsadlariga erishish uchun turli xil vositalar, APIlar va hatto boshqa AI modellari bilan o'zaro aloqada bo'lishlari mumkin va tanqidiy jihatdan ular doimiy holatni saqlab qolishlari mumkin, ya'ni ular oldingi harakatlarni eslab qolishadi va vaqt o'tishi bilan maqsad sari ishlashda davom etadilar. Bu ularni odatda bitta so'rovni bajaradigan va keyin qayta tiklanadigan odatiy generativ AIdan tubdan farq qiladi. Agentlik xatti-harakatlarining oddiy taksonomiyasi Biz agentning xatti-harakatlarini to'rtta alohida avtonomiya rejimiga ajratishimiz mumkin. Ular ko'pincha progressiyaga o'xshasa-da, ular mustaqil ish rejimlari sifatida ishlaydi. Foydalanuvchi agentga rejalashtirish uchun avtonom harakat qilishiga ishonishi mumkin, lekin uni moliyaviy operatsiyalar uchun “taklif rejimida” ushlab turishi mumkin. Biz ushbu darajalarni avtonom avtomobillar uchun sanoat standartlarini (SAE darajalari) raqamli foydalanuvchi tajribasi kontekstlariga moslashtirish orqali oldik. Kuzatish va taklif qilish Agent monitor vazifasini bajaradi. U ma'lumotlar oqimini tahlil qiladi va anomaliyalar yoki imkoniyatlarni belgilaydi, lekin nol chora ko'radi. Differentsiatsiya Keyingi darajadan farqli o'laroq, agent murakkab reja yaratmaydi. Bu muammoga ishora qiladi. MisolA DevOps agenti server protsessorining keskin ko'tarilishini sezadi va qo'ng'iroq bo'yicha muhandisni ogohlantiradi. U buni qanday tuzatishga harakat qilishini bilmaydi, lekin nimadir noto'g'ri ekanligini biladi. Ushbu darajadagi dizayn va nazoratning oqibatlari,dizayn va nazorat foydalanuvchilarning takliflar bo'yicha harakat qilishlari uchun aniq, noaniq bildirishnomalarga va aniq belgilangan jarayonga ustuvor ahamiyat berishi kerak. Asosiy e'tibor foydalanuvchini nazoratni o'z zimmasiga olmasdan o'z vaqtida va tegishli ma'lumotlar bilan kengaytirishga qaratilgan. UX amaliyotchilari takliflarni aniq va tushunarli qilishga e'tibor qaratishlari kerak, mahsulot menejerlari esa tizim foydalanuvchini haddan tashqari oshirmasdan qiymat berishini ta'minlashi kerak. Reja va taklif Agent maqsadni aniqlaydi va unga erishish uchun ko'p bosqichli strategiyani ishlab chiqadi. U insoniy tekshiruvning to'liq rejasini taqdim etadi. Differentsiatsiya Agent strateg vazifasini bajaradi. U bajarilmaydi; u butun yondashuv bo'yicha tasdiqlashni kutadi. Misol: Xuddi shu DevOps agenti protsessor ko'tarilishini sezadi, jurnallarni tahlil qiladi va tuzatish rejasini taklif qiladi:
Ikki qo'shimcha misolni aylantiring. Yuk balanslagichini qayta ishga tushiring. Eski jurnallarni arxivlash.
Odam mantiqni ko'rib chiqadi va "Rejani tasdiqlash" tugmasini bosing. Dizayn va nazorat uchun ta'sir Rejalashtiruvchi va taklif qiluvchi agentlar uchun dizayn taklif etilayotgan rejalar oson tushunarli bo'lishini va foydalanuvchilarga ularni o'zgartirish yoki rad etishning intuitiv usullarini ta'minlashi kerak. Takliflar sifati va agentning rejalashtirish mantig'ini kuzatishda nazorat juda muhimdir. UX amaliyotchilari tavsiya etilgan rejalarning aniq vizualizatsiyasini ishlab chiqishlari kerak va mahsulot menejerlari aniq ko'rib chiqish va tasdiqlash ish oqimlarini o'rnatishlari kerak. Tasdiqlash bilan harakat qilish Agent barcha tayyorgarlik ishlarini yakunlaydi va yakuniy harakatni bosqichli holatga keltiradi. Eshikni samarali ravishda ochiq ushlab turadi, bosh silkitishni kutadi. Differentsiatsiya Bu "Rejalash va taklif qilish" dan farq qiladi, chunki ish allaqachon bajarilgan va sahnalashtirilgan. Ishqalanishni kamaytiradi. Foydalanuvchi strategiyani emas, balki natijani tasdiqlaydi. MisolA yollash agenti beshta suhbat taklifnomasini tuzadi, taqvimlarda ochiq vaqtlarni topadi va taqvim tadbirlarini yaratadi. U "Hammasini yuborish" tugmachasini taqdim etadi. Foydalanuvchi tashqi harakatni boshlash uchun yakuniy ruxsatni beradi. Dizayn va nazoratga ta'siri. Agentlar tasdiqlash bilan harakat qilganda, dizayn potentsial oqibatlarni aniq ko'rsatib, mo'ljallangan harakatning shaffof va qisqa xulosalarini taqdim etishi kerak. Nazorat tasdiqlash jarayoni ishonchli ekanligini va foydalanuvchilardan harakatlarni ko'r-ko'rona tasdiqlash so'ralmasligini tekshirishi kerak. UX amaliyotchilari aniq va barcha kerakli ma'lumotlarni taqdim etadigan tasdiqlash ko'rsatmalarini ishlab chiqishlari kerak va mahsulot menejerlari barcha tasdiqlangan harakatlar uchun ishonchli audit yo'liga ustunlik berishlari kerak. Harakat - avtonom Agent vazifalarni belgilangan chegaralar doirasida mustaqil ravishda bajaradi. FarqlashFoydalanuvchi harakatlarning o'zini emas, balki harakatlar tarixini ko'rib chiqadi. Misol: Ishga qabul qilish agenti ziddiyatni ko'radi, suhbatni zaxiraga o'tkazadi, nomzodni yangilaydi va ishga qabul qilish bo'yicha menejerga xabar beradi. Odam faqat bildirishnomani ko'radi: Suhbat seshanbaga ko'chirildi. Dizayn va nazoratga ta'siri Avtonom agentlar uchun dizayn aniq oldindan tasdiqlangan chegaralarni o'rnatishi va ishonchli monitoring vositalarini ta'minlashi kerak. Nazorat agentning ushbu chegaralar ichida ishlashini doimiy ravishda baholashni, ishonchli jurnalga bo'lgan muhim ehtiyojni, aniq bekor qilish mexanizmlarini va foydalanuvchi nazorati va ishonchini saqlab qolish uchun foydalanuvchi tomonidan belgilangan o'chirish kalitlarini talab qiladi. UX amaliyotchilari avtonom agentning xatti-harakatlarini kuzatish uchun samarali boshqaruv panelini ishlab chiqishga e'tibor qaratishlari kerak va mahsulot menejerlari aniq boshqaruv va axloqiy ko'rsatmalar mavjudligini ta'minlashi kerak.
Keling, ushbu rejimlarni amalda ko'rish uchun HR texnologiyasidagi haqiqiy dunyo ilovasini ko'rib chiqaylik. Ishga olish logistikasini boshqarish uchun mo'ljallangan "Intervyularni muvofiqlashtiruvchi agent" ni ko'rib chiqing.
Taklif rejimida agent intervyu oluvchi ikki martalik band qilinganligini sezadi. Bu ishga yollovchining asboblar panelidagi ziddiyatga urg'u beradi: "Ogohlantirish: Sara soat 14:00 da bo'ladigan intervyuga ikki marta bron qilingan." Reja rejimida agent Saraning kalendarini va nomzodning mavjudligini tahlil qiladi. Bu yechimni taqdim etadi: "Men suhbatni payshanba kuni ertalab soat 10 ga ko'chirishni maslahat beraman. Buning uchun Saraning menejeri bilan 1:1 hisobini ko'chirish kerak." Ishga qabul qiluvchi bu mantiqni ko'rib chiqadi. Tasdiqlash rejimida agent nomzod va menejerga elektron pochta xabarlarini tuzadi. U kalendar takliflarini to'ldiradi. Ishga yollovchi xulosani ko'radi: "Payshanbaga ko'chirishga tayyormisiz. Yangilanishlar yuborilsinmi?" Ishga qabul qiluvchi "Tasdiqlash" tugmasini bosadi. Avtonom rejimda agent ziddiyatni bir zumda hal qiladi. Bu oldindan o'rnatilgan qoidaga rioya qiladi: "Har doim nomzodlarning intervyularini ichki 1: 1 ga nisbatan birinchi o'ringa qo'ying." U uchrashuvni boshqa joyga ko'chiradi va bildirishnomalarni yuboradi. Ishga qabul qiluvchi jurnaldagi yozuvni ko'radi: “Yechildinomzod B uchun ziddiyatni rejalashtirish.
Tadqiqot primeri: nimani va qanday tadqiq qilish kerak Samarali agent AIni ishlab chiqish an'anaviy dasturiy ta'minot yoki hatto generativ AI bilan solishtirganda aniq tadqiqot yondashuvini talab qiladi. AI agentlarining avtonom tabiati, ularning qaror qabul qilish qobiliyati va faol harakat qilish potentsiali foydalanuvchi kutishlarini tushunish, murakkab agent xatti-harakatlarini xaritalash va yuzaga kelishi mumkin bo'lgan nosozliklarni kutish uchun maxsus metodologiyalarni talab qiladi. Quyidagi tadqiqot primeri agentlik AIning ushbu noyob jihatlarini o'lchash va baholashning asosiy usullarini tavsiflaydi. Mental-model intervyular Ushbu intervyular foydalanuvchilarning AI agenti o'zini qanday tutishi kerakligi haqidagi oldindan o'ylangan fikrlarini ochib beradi. Foydalanuvchilar nimani xohlashlarini so'rash o'rniga, asosiy e'tibor agentning imkoniyatlari va cheklovlarining ichki modellarini tushunishga qaratilgan. Ishtirokchilar bilan "agent" so'zini ishlatishdan qochishimiz kerak. U ilmiy-fantastik yuklarni olib yuradi yoki bu atama yordam yoki xizmatlarni taklif qiluvchi inson agenti bilan osongina chalkashib ketadi. Buning o'rniga, "yordamchilar" yoki "tizim" atrofida muhokama qiling. Biz foydalanuvchilar foydali avtomatlashtirish va intruziv boshqaruv o'rtasidagi chegarani qayerda aniqlashimiz kerak.
Usul: Foydalanuvchilardan turli taxminiy stsenariylarda agent bilan kutilgan o'zaro munosabatlarini tasvirlash, chizish yoki hikoya qilishlarini so'rang. Asosiy problar (turli sohalarni aks ettiruvchi): Kerakli avtomatlashtirish chegaralarini va ortiqcha avtomatlashtirish bilan bog'liq potentsial tashvishlarni tushunish uchun so'rang: Agar parvozingiz bekor qilinsa, tizim avtomatik ravishda nima qilishini xohlaysiz? Agar u sizning aniq ko'rsatmangizsiz shunday qilsa, sizni nima tashvishga solardi?
Foydalanuvchining agentning ichki jarayonlari va zarur aloqalari haqidagi tushunchasini o‘rganish uchun so‘rang: Tasavvur qiling-a, raqamli yordamchi sizning aqlli uyingizni boshqarmoqda. Agar paket yetkazib berilsa, u qanday qadamlar qo'yishini tasavvur qilasiz va qanday ma'lumot olishni kutgan bo'lardingiz?
Ko'p bosqichli jarayonda nazorat va rozilik bilan bog'liq taxminlarni aniqlash uchun so'rang: Agar siz raqamli yordamchingizdan uchrashuvni rejalashtirishni so'rasangiz, u qanday qadamlar qo'yishini tasavvur qilasiz? Qaysi nuqtalarda sizga maslahat berishni yoki tanlashni xohlaysiz?
Usulning afzalliklari: yashirin taxminlarni ochib beradi, agentning rejalashtirilgan xatti-harakati foydalanuvchi kutganidan farq qilishi mumkin bo'lgan sohalarni ta'kidlaydi va tegishli boshqaruv va qayta aloqa mexanizmlarini loyihalash haqida ma'lumot beradi.
Agent sayohat xaritasi: An'anaviy foydalanuvchi sayohati xaritasiga o'xshab, agent sayohat xaritasi, ayniqsa, foydalanuvchining o'zaro ta'siri bilan bir qatorda, AI agentining kutilgan harakatlariga va qaror qabul qilish nuqtalariga qaratilgan. Bu potentsial tuzoqlarni faol ravishda aniqlashga yordam beradi.
Usul: Agent faoliyatining turli bosqichlarini, shu jumladan, barcha mumkin bo'lgan harakatlar, qarorlar va tashqi tizimlar yoki foydalanuvchilar bilan o'zaro aloqalarini ko'rsatadigan vizual xaritani yarating. Xaritaning asosiy elementlari: Agent harakatlari: Agent qanday aniq vazifalar yoki qarorlarni bajaradi? Axborotning kirish/chiqishlari: agentga qanday ma'lumotlar kerak va u qanday ma'lumotlarni yaratadi yoki muloqot qiladi? Qaror nuqtalari: Agent qayerda tanlov qiladi va bu tanlovlar uchun mezonlar qanday? Foydalanuvchi bilan o'zaro aloqa nuqtalari: Foydalanuvchi qayerda ma'lumotlarni kiritadi, ko'rib chiqadi yoki harakatlarni tasdiqlaydi? Muvaffaqiyatsizlik nuqtalari: Muhimi, agent ko'rsatmalarni noto'g'ri talqin qilishi, noto'g'ri qaror qabul qilishi yoki noto'g'ri tashkilot bilan aloqa qilishi mumkin bo'lgan aniq holatlarni aniqlang. Misollar: noto'g'ri qabul qiluvchi (masalan, maxfiy ma'lumotlarni noto'g'ri shaxsga yuborish), overdraft (masalan, mavjud mablag'lardan oshib ketadigan avtomatlashtirilgan to'lov), niyatni noto'g'ri talqin qilish (masalan, noaniq til tufayli noto'g'ri sanaga parvozni bron qilish).
Qayta tiklash yo'llari: agent yoki foydalanuvchi ushbu nosozliklardan qanday qutulishi mumkin? Tuzatish yoki aralashuv uchun qanday mexanizmlar mavjud?
Usulning afzalliklari: agentning operatsion oqimining yaxlit ko'rinishini ta'minlaydi, yashirin bog'liqliklarni ochib beradi va salbiy natijalarning oldini olish yoki yumshatish uchun himoya choralarini, xatolarni qayta ishlash va foydalanuvchi aralashuv nuqtalarini faol loyihalash imkonini beradi.
Simulyatsiya qilingan noto'g'ri xatti-harakatlar testi: Ushbu yondashuv tizimni stress sinovidan o'tkazish va AI agenti ishlamay qolganda yoki kutilganidan chetga chiqqanda foydalanuvchi reaktsiyalarini kuzatish uchun mo'ljallangan. Bu ishonchni tiklash va salbiy vaziyatlarda hissiy javoblarni tushunish haqida.
Usul: Nazorat qilinadigan laboratoriya ishlarida agent xatoga yo'l qo'yadigan, buyruqni noto'g'ri talqin qiladigan yoki kutilmagan tarzda o'zini tutadigan stsenariylarni ataylab kiriting. Simulyatsiya qilish uchun "noto'g'ri xatti-harakatlar" turlari: BuyruqNoto'g'ri talqin qilish: Agent foydalanuvchi mo'ljallanganidan biroz farqli harakatni amalga oshiradi (masalan, bitta emas, ikkita elementga buyurtma berish). Axborotning haddan tashqari yuklanishi/yuklanishi: agent juda ko'p ahamiyatsiz ma'lumotlarni taqdim etadi yoki etarli darajada muhim tafsilotlarni bermaydi. Keraksiz harakat: Agent foydalanuvchi aniq istamagan yoki kutmagan harakatni amalga oshiradi (masalan, ruxsatsiz aktsiyalarni sotib olish). Tizim xatosi: agent ishdan chiqadi, javob bermayapti yoki xato xabari beradi. Axloqiy dilemmalar: Agent axloqiy oqibatlarga olib keladigan qaror qabul qiladi (masalan, kutilmagan ko'rsatkich asosida bir vazifani boshqasidan ustun qo'yish).
Kuzatuv markazi: Foydalanuvchilarning reaktsiyalari: foydalanuvchilar hissiy jihatdan qanday munosabatda bo'lishadi (xafagarchilik, g'azab, chalkashlik, ishonchni yo'qotish)? Qayta tiklash urinishlari: foydalanuvchilar agentning xatti-harakatlarini tuzatish yoki uning harakatlarini bekor qilish uchun qanday choralar ko'radi? Ishonchni tiklash mexanizmlari: tizimning o'rnatilgan tiklash yoki qayta aloqa mexanizmlari ishonchni tiklashga yordam beradimi? Qanday qilib foydalanuvchilar xatolar haqida xabardor bo'lishni xohlashadi? Ruhiy model o'zgarishi: noto'g'ri xatti-harakatlar foydalanuvchining agentning imkoniyatlari yoki cheklovlari haqidagi tushunchasini o'zgartiradimi?
Usulning afzalliklari: xatolarni tiklash, fikr-mulohazalar va foydalanuvchi nazorati bilan bog'liq dizayn bo'shliqlarini aniqlash uchun juda muhimdir. U foydalanuvchilar agentning nosozliklariga qanchalik chidamli ekanligi va ishonchni saqlab qolish yoki qayta tiklash uchun nima zarurligi haqida tushuncha beradi, bu esa yanada mustahkamroq va kechirimli agent tizimlariga olib keladi.
Ushbu tadqiqot metodologiyalarini integratsiyalashgan holda, UX amaliyotchilari agent tizimlarini ishonchli, nazorat qilinadigan va mas'uliyatli qilish, foydalanuvchilar va ularning sun'iy intellekt agentlari o'rtasida ijobiy va samarali munosabatlarni rivojlantirish uchun foydalanishga yaroqli qilishdan tashqariga o'tishlari mumkin. E'tibor bering, bular agentlik AIni samarali o'rganishga tegishli yagona usullar emas. Boshqa ko'plab usullar mavjud, ammo ular yaqin kelajakda amaliyotchilar uchun eng qulaydir. Men ilgari Oz ustasi usulini, kontseptsiyani sinab ko'rishning biroz ilg'or usulini ko'rib chiqdim, bu ham agentlik AI tushunchalarini o'rganish uchun qimmatli vositadir. Tadqiqot metodologiyasida axloqiy mulohazalar Agentlik AIni tadqiq qilishda, ayniqsa noto'g'ri xatti-harakatlar yoki xatolarni simulyatsiya qilishda, axloqiy fikrlarni hisobga olish kerak. UX bo'yicha axloqiy tadqiqotlarga qaratilgan ko'plab nashrlar mavjud, jumladan men Smashing jurnali uchun yozgan maqolam, UX Dizayn Institutining ushbu ko'rsatmalari va Inklyuziv Dizayn asboblar to'plamining ushbu sahifasi. Agent AI uchun asosiy ko'rsatkichlar Agentlik AI tizimlarining ishlashi va ishonchliligini samarali baholash uchun sizga keng qamrovli asosiy ko'rsatkichlar to'plami kerak bo'ladi. Ushbu ko'rsatkichlar foydalanuvchi ishonchi, tizimning aniqligi va umumiy foydalanuvchi tajribasi haqida tushuncha beradi. Ushbu ko'rsatkichlarni kuzatish orqali ishlab chiquvchilar va dizaynerlar yaxshilanishi kerak bo'lgan sohalarni aniqlashlari va AI agentlarining xavfsiz va samarali ishlashini ta'minlashlari mumkin. 1. Intervensiya darajasi Avtonom agentlar uchun biz muvaffaqiyatni sukut bilan o'lchaymiz. Agar agent vazifani bajarsa va foydalanuvchi belgilangan oynada (masalan, 24 soat) aralashmasa yoki harakatni bekor qilmasa, biz buni qabul qilingan deb hisoblaymiz. Biz aralashish tezligini kuzatamiz: odam agentni to'xtatish yoki tuzatish uchun qanchalik tez-tez sakrab chiqadi? Yuqori aralashuv darajasi ishonch yoki mantiqning noto'g'ri ekanligini ko'rsatadi. 2. 1000 ta topshiriq uchun ko‘zda tutilmagan harakatlar chastotasi Bu muhim ko‘rsatkich 1000 ta bajarilgan vazifa uchun normallashtirilgan AI agenti tomonidan foydalanuvchi tomonidan istalmagan yoki kutilmagan harakatlar sonini aniqlaydi. Ko'zda tutilmagan harakatlarning past chastotasi foydalanuvchi niyatini to'g'ri talqin qiladigan va belgilangan chegaralar ichida ishlaydigan yaxshi moslashtirilgan AIni bildiradi. Ushbu ko'rsatkich AIning kontekstni tushunishi, buyruqlarni ajratish qobiliyati va xavfsizlik protokollarining mustahkamligi bilan chambarchas bog'liq. 3. Orqaga qaytarish yoki bekor qilish stavkalariUshbu ko'rsatkich foydalanuvchilarning AI tomonidan bajarilgan amalni qanchalik tez-tez o'zgartirishi yoki bekor qilishi kerakligini kuzatadi. Yuqori orqaga qaytarish stavkalari AI tez-tez xatolarga yo'l qo'yishi, ko'rsatmalarni noto'g'ri talqin qilish yoki foydalanuvchi kutganiga mos kelmaydigan tarzda harakat qilishini ko'rsatadi. Ushbu orqaga qaytish sabablarini tahlil qilish AI algoritmlarini takomillashtirish, foydalanuvchi imtiyozlarini tushunish va istalgan natijalarni bashorat qilish qobiliyati uchun qimmatli fikr-mulohazalarni berishi mumkin. Buning sababini tushunish uchun siz bekor qilish bo'yicha mikrosurveyni amalga oshirishingiz kerak. Masalan, foydalanuvchi vaqtni o'zgartirishni bekor qilganda, oddiy so'rov so'rashi mumkin: "Vaqt noto'g'ri? Noto'g'ri odammi? Yoki buni o'zingiz qilishni xohladingizmi?" Foydalanuvchiga ularning fikriga eng mos keladigan variantni bosishga ruxsat berish. 4. Xatodan keyin hal qilish vaqtiBu ko'rsatkichfoydalanuvchi AI tomonidan qilingan xatoni tuzatishi yoki AI tizimining o'zi noto'g'ri holatdan tiklanishi uchun zarur bo'lgan vaqtni o'lchaydi. Yechish uchun qisqa vaqt, foydalanuvchi umidsizliklarini yumshatish va samaradorlikni saqlashi mumkin bo'lgan samarali va foydalanuvchilarga qulay xatolarni tiklash jarayonini ko'rsatadi. Bunga xatoni aniqlash qulayligi, bekor qilish yoki tuzatish mexanizmlaridan foydalanish imkoniyati va AI tomonidan taqdim etilgan xato xabarlarining ravshanligi kiradi.
Ushbu koʻrsatkichlarni toʻplash uchun tizimingizni Agent Action ID-larini kuzatish uchun asbob-uskunalar bilan taʼminlash kerak. Jadvalni taklif qilish yoki parvozni bron qilish kabi agent amalga oshiradigan har bir alohida harakat jurnallarda saqlanadigan noyob identifikatorni yaratishi kerak. Intervensiya tezligini o'lchash uchun biz darhol foydalanuvchi reaktsiyasini qidirmaymiz. Biz belgilangan oynada qarshi harakatning yo'qligini qidiramiz. Agar Harakat identifikatori ertalab soat 9:00 da yaratilgan bo'lsa va hech bir foydalanuvchi ushbu identifikatorni ertasi kuni soat 9:00 ga qadar o'zgartirmasa yoki qaytarmasa, tizim mantiqiy ravishda uni Qabul qilingan deb belgilaydi. Bu bizga muvaffaqiyatni faol tasdiqlashdan ko'ra foydalanuvchi sukunati asosida baholash imkonini beradi. Orqaga qaytarish stavkalari uchun xom hisoblar etarli emas, chunki ularda kontekst yo'q. Asosiy sababni aniqlash uchun ilovangizning Bekor qilish yoki Orqaga qaytarish funksiyalarida kesish mantig‘ini qo‘llashingiz kerak. Agar foydalanuvchi agent tomonidan boshlangan harakatni bekor qilganda, engil mikrosurveyni ishga tushiring. Bu oddiy uch variantli modal bo'lishi mumkin, u foydalanuvchidan xatoni haqiqatda noto'g'ri, kontekst yo'qligi yoki vazifani qo'lda bajarish uchun oddiy afzallik sifatida tasniflashni so'raydi. Bu miqdoriy telemetriyani sifatli tushunish bilan birlashtiradi. Bu muhandislik guruhlariga buzilgan algoritm va foydalanuvchi afzalliklari mos kelmasligini farqlash imkonini beradi. Ushbu ko'rsatkichlar izchil kuzatilganda va har tomonlama tahlil qilinganda, agentlik AI tizimlarining ishlashini baholash uchun mustahkam asos bo'lib, nazorat, rozilik va javobgarlikni doimiy ravishda yaxshilash imkonini beradi. Aldashga qarshi dizayn Agentlarning qobiliyatlari oshib borishi bilan biz yangi xavfga duch kelamiz: Agent Sludge. An'anaviy loy ishqalanishni keltirib chiqaradi, bu obunani bekor qilishni yoki hisobni o'chirishni qiyinlashtiradi. Agentli loy teskari ta'sir qiladi. Bu xatoga ishqalanishni bartaraf qiladi, bu esa foydalanuvchining o'z manfaatlaridan ko'ra biznesga foyda keltiradigan harakatga rozi bo'lishini juda oson qiladi. Sayohat bron qilishda yordam beradigan agentni ko'rib chiqing. Aniq to'siqlarsiz tizim hamkor aviakompaniyaga yoki yuqori marjali mehmonxonaga ustunlik berishi mumkin. U ushbu tanlovni optimal yo'l sifatida taqdim etadi. Tizim vakolatiga ishongan foydalanuvchi tavsiyani tekshirmasdan qabul qiladi. Bu tizim qulaylik niqobi ostida daromadni optimallashtiradigan aldamchi naqsh yaratadi. Yolg'on tasavvur qilingan kompetentsiya xavfi Aldash yomon niyatdan kelib chiqmasligi mumkin. U ko'pincha AIda tasavvur qilingan kompetensiya sifatida namoyon bo'ladi. Katta tilli modellar noto'g'ri bo'lsa ham, ko'pincha obro'li bo'lib chiqadi. Ular bronlashning noto'g'ri tasdig'ini yoki noto'g'ri xulosani tasdiqlangan fakt bilan bir xil ishonch bilan taqdim etadilar. Foydalanuvchilar tabiiy ravishda bu ishonchli ohangga ishonishlari mumkin. Ushbu nomuvofiqlik tizim qobiliyati va foydalanuvchi kutishlari o'rtasida xavfli bo'shliqni yaratadi. Biz ushbu bo'shliqni bartaraf etish uchun maxsus loyihalashimiz kerak. Agar agent vazifani bajara olmasa, interfeys bu xato haqida aniq signal berishi kerak. Agar tizim ishonchsiz bo'lsa, u jilolangan nasr bilan niqoblashdan ko'ra noaniqlikni ifodalashi kerak. Primitivlar orqali shaffoflik Loyga ham, gallyutsinatsiyaga ham antidot kelib chiqishi hisoblanadi. Har bir avtonom harakat qarorning kelib chiqishini tushuntiruvchi maxsus metadata yorlig'ini talab qiladi. Foydalanuvchilar natija ortidagi mantiqiy zanjirni tekshirish qobiliyatiga muhtoj. Bunga erishish uchun biz ibtidoiy so'zlarni amaliy javoblarga aylantirishimiz kerak. Dasturiy ta'minot muhandisligida ibtidoiylar agent bajaradigan ma'lumotlar yoki harakatlarning asosiy birliklariga ishora qiladi. Muhandis uchun bu API chaqiruvi yoki mantiqiy eshik kabi ko'rinadi. Foydalanuvchi uchun bu aniq tushuntirish sifatida ko'rinishi kerak. Dizayn muammosi ushbu texnik bosqichlarni inson tomonidan o'qilishi mumkin bo'lgan asoslar bilan taqqoslashdan iborat. Agar agent ma'lum bir parvozni tavsiya qilsa, foydalanuvchi nima uchun ekanligini bilishi kerak. Interfeys umumiy taklif orqasida yashirina olmaydi. U asosiy ibtidoiyni ochishi kerak: Mantiq: Eng arzon_to'g'ridan-to'g'ri parvoz yoki Mantiq: Partner_Airline_Priority. 4-rasmda ushbu tarjima oqimi tasvirlangan. Biz xom tizimni ibtidoiy qabul qilamiz - haqiqiy kod mantig'i - va uni foydalanuvchiga qaragan satr bilan taqqoslaymiz. Masalan, yig'ilishning taqvim jadvalini oddiy tekshirish aniq bayonotga aylanadi: men soat 16:00 ni taklif qildim.uchrashuv. Ushbu shaffoflik darajasi agentning harakatlari mantiqiy va foydali bo'lishini ta'minlaydi. Bu foydalanuvchiga agentning o'z manfaatlarini ko'zlab harakat qilganligini tekshirish imkonini beradi. Ibtidoiy narsalarni fosh qilish orqali biz qora qutini shisha qutiga aylantiramiz va foydalanuvchilarning raqamli hayotlarida yakuniy hokimiyat bo'lib qolishlarini ta'minlaymiz.
Dizayn uchun sahnani o'rnatish Agentlik tizimini yaratish psixologik va xulq-atvorni tushunishning yangi darajasini talab qiladi. Bu bizni an'anaviy foydalanish testlaridan tashqari ishonch, rozilik va javobgarlik sohasiga o'tishga majbur qiladi. Biz muhokama qilgan tadqiqot usullari, aqliy modellarni tekshirishdan tortib, noto'g'ri xatti-harakatlarni taqlid qilish va yangi ko'rsatkichlarni o'rnatishgacha, kerakli asosni beradi. Ushbu amaliyotlar avtonom tizim qayerda ishlamay qolishi mumkinligini va, eng muhimi, foydalanuvchi-agent munosabatlarini qanday tuzatishni proaktiv tarzda aniqlash uchun muhim vositalardir. Agentlik AIga o'tish foydalanuvchi va tizim munosabatlarining qayta ta'rifidir. Biz endi oddiygina buyruqlarga javob beradigan vositalarni loyihalashtirmayapmiz; biz nomimizdan ishlaydigan hamkorlar uchun loyihalashtirmoqdamiz. Bu dizayn imperativini samaradorlik va foydalanish qulayligidan shaffoflik, bashoratlilik va nazoratga o'zgartiradi. Agar sun'iy intellekt oxirgi marta bosmasdan parvozni bron qilishi yoki aktsiyalarni sotishi mumkin bo'lsa, uning "rampalarda" va "pandusdan tashqarida" dizayni muhim ahamiyatga ega. Foydalanuvchilar g'ildirakni topshirganlarida ham o'zlarini haydovchi o'rindig'ida his qilishlarini ta'minlash bizning mas'uliyatimizdir. Ushbu yangi haqiqat UX tadqiqotchisi rolini ham oshiradi. Biz foydalanuvchilar ishonchining saqlovchisiga aylanamiz, muhandislar va mahsulot menejerlari bilan hamkorlikda agent avtonomiyasining himoya chegaralarini aniqlash va sinab ko'rish uchun ishlaymiz. Biz tadqiqotchi bo'lishdan tashqari, ishlab chiqish jarayonida foydalanuvchi nazorati, shaffoflik va axloqiy kafolatlar tarafdori bo'lamiz. Primitivlarni amaliy savollarga tarjima qilish va eng yomon stsenariylarni taqlid qilish orqali biz kuchli va xavfsiz mustahkam tizimlarni yaratishimiz mumkin. Ushbu maqolada agentlik AIni o'rganishning "nima" va "nima uchun" ko'rsatilgan. Bu bizning an'anaviy asboblar to'plamimiz etarli emasligini va biz yangi, istiqbolli metodologiyalarni qabul qilishimiz kerakligini ko'rsatdi. Keyingi maqola ushbu asosga asoslanib, agentning yordam dasturini foydalanuvchilar uchun shaffof qiladigan maxsus dizayn naqshlari va tashkiliy amaliyotlarni taqdim etadi va ular agentlik AI kuchidan ishonch va nazorat bilan foydalanishlarini ta'minlaydi. UX kelajagi tizimlarni ishonchli qilishdan iborat. Agentlik AI haqida qo'shimcha ma'lumot olish uchun siz quyidagi manbalarni o'rganishingiz mumkin:
Agentic AI-da Google AI blogi Microsoft-ning AI agentlari bo'yicha tadqiqotlari