Agentic AI тұтынушылардың тәжірибесі мен операциялық тиімділігін өзгертуге дайын, бұл көшбасшылықтан жаңа стратегиялық көзқарасты қажет етеді. Жасанды интеллекттегі бұл эволюция жүйелерге тапсырмаларды жоспарлауға, орындауға және табанды болуға мүмкіндік береді, бұл қарапайым ұсыныстардан тыс белсенді әрекетке көшу. UX командалары, өнім менеджерлері және басшылар үшін бұл ауысымды түсіну инновациядағы мүмкіндіктерді ашу, жұмыс процестерін оңтайландыру және технологияның адамдарға қалай қызмет ететінін қайта анықтау үшін өте маңызды. Agentic AI-ны роботтық процестерді автоматтандырумен (RPA) шатастыру оңай, ол компьютерлерде орындалатын ережелерге негізделген тапсырмаларға бағытталған технология. Айырмашылық қатаңдық пен пайымдау болып табылады. RPA қатаң сценарийді орындауда өте жақсы: егер X орын алса, Y орындаңыз. Ол адамның қолына еліктейді. Агенттік AI адамның ойлауын еліктейді. Ол сызықтық сценарийді ұстанбайды; бірін жасайды. Жалдау жұмыс процесін қарастырыңыз. RPA боты түйіндемені сканерлеп, оны дерекқорға жүктей алады. Қайталанатын тапсырманы мүлтіксіз орындайды. Агенттік жүйе түйіндемені қарайды, үміткер нақты сертификаттауды, жаңа клиент талабы бар айқас сілтемелерді тізімдейтінін байқайды және сәйкестікті бөлектей отырып, жекелендірілген ақпараттық электрондық пошта жобасын жасауды шешеді. RPA алдын ала белгіленген жоспарды орындайды; Агенттік AI мақсатқа негізделген жоспарды құрастырады. Бұл автономия агенттерді біз соңғы онжылдықта пайдаланған болжамдық құралдардан бөледі. Тағы бір мысал - кездесу қақтығыстарын басқару. Күнтізбеңізге біріктірілген болжамды модель жиналыс кестесін және әріптестеріңіздің кестелерін талдауы мүмкін. Содан кейін ол бір уақытта жоспарланған екі маңызды кездесу немесе негізгі қатысушы демалыста болған кезде жоспарланған кездесу сияқты ықтимал қайшылықтарды ұсына алады. Ол сізге ақпарат береді және ықтимал мәселелерді белгілейді, бірақ сіз әрекет ету үшін жауаптысыз. Агенттік AI, сол сценарийде, алдын алу үшін тек қақтығыстарды ұсынып қана қоймайды. Негізгі қатысушымен қайшылықты анықтаған кезде агент келесі әрекеттерді жасай алады:

Барлық қажетті қатысушылардың болуын тексеру. Барлығы үшін жұмыс істейтін баламалы уақыт аралығын анықтау. Барлық қатысушыларға ұсынылған жаңа жиналысқа шақыруларды жіберу. Егер қайшылық сыртқы қатысушымен болса, агент басқа уақытты жоспарлау және балама уақыттарды ұсыну қажеттілігін түсіндіретін электрондық хаттың жобасын жасап, жібере алады. Күнтізбеңіз бен әріптестеріңіздің күнтізбелері расталғаннан кейін жаңа жиналыс мәліметтерімен жаңартылуда.

Бұл агенттік AI мақсатты түсінеді (жиналыс қайшылығын шешу), қадамдарды жоспарлайды (қолжетімділікті тексеру, балама нұсқаларды табу, шақыруларды жіберу), сол қадамдарды орындайды және жанжал шешілгенше әрекет етеді, барлығы пайдаланушының тікелей минималды араласуымен. Бұл «агенттік» айырмашылықты көрсетеді: жүйе пайдаланушыға ақпарат берудің орнына, пайдаланушы үшін белсенді қадамдар жасайды. Агенттік AI жүйелері мақсатты түсінеді, оған жету үшін бірқатар қадамдарды жоспарлайды, сол қадамдарды орындайды және тіпті қателік кеткен жағдайда бейімделеді. Оны белсенді цифрлық көмекші ретінде елестетіп көріңіз. Негізгі технология күрделі тапсырмаларды басқарылатын әрекеттерге бөлетін жоспарлау алгоритмдерімен түсіну және пайымдау үшін жиі үлкен тіл үлгілерін (LLM) біріктіреді. Бұл агенттер мақсаттарына жету үшін әртүрлі құралдармен, API интерфейстерімен және тіпті басқа AI үлгілерімен өзара әрекеттесе алады және сыни тұрғыдан алғанда, олар тұрақты күйді сақтай алады, яғни олар бұрынғы әрекеттерді есте сақтайды және уақыт өте келе мақсатқа қарай жұмыс істей береді. Бұл оларды әдетте бір сұрауды орындайтын, содан кейін қалпына келтіретін әдеттегі генеративті AI-дан түбегейлі ерекшеленеді. Агенттік мінез-құлықтың қарапайым таксономиясы Біз агент әрекетін автономияның төрт түрлі режиміне жіктей аламыз. Олар көбінесе прогрессия сияқты көрінгенімен, олар тәуелсіз жұмыс режимдері ретінде жұмыс істейді. Пайдаланушы агентке жоспарлау үшін автономды әрекет ететініне сенуі мүмкін, бірақ оны қаржылық транзакциялар үшін «ұсыныс режимінде» қалдырады. Біз бұл деңгейлерді сандық пайдаланушы тәжірибесі контексттеріне автономды көліктерге арналған салалық стандарттарды (SAE деңгейлері) бейімдеу арқылы алдық. Бақылаңыз және ұсыныңыз Агент монитор ретінде жұмыс істейді. Ол деректер ағындарын талдайды және ауытқуларды немесе мүмкіндіктерді белгілейді, бірақ нөлдік әрекетті қабылдайды. Дифференциация Келесі деңгейге қарағанда агент күрделі жоспар жасамайды. Бұл мәселеге нұсқайды. МысалA DevOps агенті сервердегі процессордың жоғарылауын байқап, шақыру бойынша инженерге ескертеді. Ол оны қалай түзетуге тырысатынын білмейді, бірақ бірдеңе дұрыс емес екенін біледі. Осы деңгейде жобалау және қадағалау үшін салдары,жобалау және қадағалау нақты, интрузивті емес хабарландыруларға және пайдаланушыларға ұсыныстар бойынша әрекет ету үшін нақты анықталған процеске басымдық беруі керек. Негізгі назар пайдаланушыны бақылаусыз уақтылы және маңызды ақпаратпен кеңейтуге бағытталған. UX тәжірибешілері ұсыныстарды түсінікті және түсінуге оңай жасауға назар аударуы керек, ал өнім менеджерлері жүйенің пайдаланушыны артық етпестен құндылықты қамтамасыз етуі керек. Жоспар және ұсыныс Агент мақсатты анықтайды және оған жету үшін көп сатылы стратегияны жасайды. Ол адам қарауының толық жоспарын ұсынады. Дифференциация Агент стратег ретінде әрекет етеді. Ол орындалмайды; ол бүкіл тәсіл бойынша мақұлдауды күтеді. Мысал Сол DevOps агенті процессордың жоғарылауын байқайды, журналдарды талдайды және түзету жоспарын ұсынады:

Қосымша екі дананы айналдырыңыз. Жүктеме балансын қайта іске қосыңыз. Ескі журналдарды мұрағаттау.

Адам логиканы қарап, «Жоспарды бекіту» түймесін басады. Жобалау мен қадағалауға қатысты салдарлар Жоспарлайтын және ұсынатын агенттер үшін дизайн ұсынылған жоспарлардың оңай түсінікті болуын және пайдаланушылардың оларды өзгерту немесе қабылдамаудың интуитивті тәсілдерін қамтамасыз етуі керек. Қадағалау ұсыныстардың сапасын және агенттің жоспарлау логикасын бақылауда өте маңызды. UX тәжірибешілері ұсынылған жоспарлардың нақты визуализациясын әзірлеуі керек, ал өнім менеджерлері нақты шолу және бекіту жұмыс процестерін орнатуы керек. Растаумен әрекет ету Агент барлық дайындық жұмыстарын аяқтайды және соңғы әрекетті кезеңдік күйге қояды. Ол басын изей отырып, есікті тиімді түрде ашық ұстайды. Дифференциация Бұл «Жоспарлау және ұсынудан» ерекшеленеді, себебі жұмыс әлдеқашан орындалған және кезеңге қойылған. Үйкелісті азайтады. Пайдаланушы стратегияны емес, нәтижені растайды. ExampleA рекрутинг агенті бес сұхбат шақыруының жобасын жасайды, күнтізбелерден ашық уақыттарды табады және күнтізбе оқиғаларын жасайды. Ол «Барлығын жіберу» түймесін көрсетеді. Пайдаланушы сыртқы әрекетті іске қосу үшін соңғы рұқсатты береді. Жобалау мен қадағалауға қатысты салдарлар Агенттер растау арқылы әрекет еткенде, жоба ықтимал салдарларды нақты көрсете отырып, жоспарланған әрекеттің мөлдір және қысқаша жиынтықтарын қамтамасыз етуі керек. Қадағалау растау процесінің сенімді екенін және пайдаланушылардан әрекеттерді соқыр мақұлдау сұралмайтынын тексеруі керек. UX тәжірибешілері анық және барлық қажетті ақпаратты ұсынатын растау нұсқаулығын әзірлеуі керек, ал өнім менеджерлері барлық расталған әрекеттер үшін сенімді аудит жолына басымдық беруі керек. Әрекет ету - дербес Агент тапсырмаларды анықталған шекараларда дербес орындайды. Саралау Пайдаланушы әрекеттердің өзін емес, әрекеттер тарихын қарайды. Мысал Жалдау агенті қайшылықты көреді, сұхбатты сақтық көшірме ұясына жылжытады, кандидатты жаңартады және жалдау менеджеріне хабарлайды. Адам тек хабарландыруды көреді: сұхбат сейсенбіге ауыстырылды. Жобалау және қадағалау үшін салдары Автономды агенттер үшін дизайн нақты алдын ала бекітілген шекараларды орнатуы және сенімді бақылау құралдарын қамтамасыз етуі керек. Қадағалау агенттің осы шекаралардағы жұмысын үздіксіз бағалауды, сенімді журнал жүргізудің маңызды қажеттілігін, нақты қайта анықтау механизмдерін және пайдаланушы бақылауы мен сенімін сақтау үшін пайдаланушы анықтайтын өшіру қосқыштарын талап етеді. UX тәжірибешілері автономды агент әрекетін бақылау үшін тиімді бақылау тақталарын жобалауға назар аударуы керек, ал өнім менеджерлері нақты басқару мен этикалық нұсқаулардың болуын қамтамасыз етуі керек.

Осы режимдерді жұмыс істеп тұрғанын көру үшін HR технологиясындағы нақты әлем қолданбасын қарастырайық. Жалдау логистикасын өңдеуге арналған «Сұхбатты үйлестіру агентін» қарастырыңыз.

Ұсыныс режимінде агент сұхбат алушының екі рет брондалғанын байқайды. Ол жалдаушының бақылау тақтасындағы қақтығысты көрсетеді: «Ескерту: Сара сағат 14.00-дегі сұхбатқа екі рет жазылды». Жоспар режимінде агент Сараның күнтізбесі мен үміткердің қолжетімділігін талдайды. Ол шешімді ұсынады: "Мен сұхбатты бейсенбіге сағат 10.00-ге ауыстыруды ұсынамын. Бұл Сараның менеджерімен 1:1 есебін ауыстыруды талап етеді." Жалдаушы бұл логиканы қарастырады. Растау режимінде агент кандидат пен менеджерге электрондық хаттардың жобасын жасайды. Ол күнтізбе шақыруларын толтырады. Жалдаушы қысқаша мәліметті көреді: "Бейсенбіге ауыстыруға дайынсыз ба. Жаңартуларды жіберу керек пе?" Жалдаушы «Растау» түймесін басады. Автономды режимде агент қақтығысты лезде өңдейді. Ол алдын ала белгіленген ережені құрметтейді: «Үміткерлер сұхбатына әрқашан ішкі 1:1-ге басымдық беріңіз». Ол жиналысты жылжытады және хабарландыруларды жібереді. Жалдаушы журнал жазбасын көреді: «Шешілдікандидат В үшін кесте қақтығысы».

Зерттеу жұмысы: нені және қалай зерттеу керек Тиімді агенттік AI әзірлеу дәстүрлі бағдарламалық жасақтамамен немесе тіпті генеративті AI-мен салыстырғанда ерекше зерттеу әдісін талап етеді. AI агенттерінің автономды табиғаты, олардың шешім қабылдау қабілеті және белсенді әрекет ету әлеуеті пайдаланушылардың күтулерін түсінуге, агенттердің күрделі әрекеттерін картаға түсіруге және ықтимал сәтсіздіктерді болжауға арналған арнайы әдістемелерді қажет етеді. Келесі зерттеу праймерінде агенттік AI-ның осы бірегей аспектілерін өлшеу және бағалаудың негізгі әдістері көрсетілген. Психикалық үлгідегі сұхбаттар Бұл сұхбаттар пайдаланушылардың AI агентінің өзін қалай ұстауы керектігі туралы алдын ала ойлаған түсініктерін ашады. Пайдаланушылар не қалайтынын жай ғана сұраудың орнына, олардың агент мүмкіндіктері мен шектеулерінің ішкі үлгілерін түсінуге назар аударылады. Қатысушылармен «агент» сөзін қолданудан аулақ болуымыз керек. Ол ғылыми-фантастикалық жүкті тасымалдайды немесе қолдау немесе қызметтерді ұсынатын адам агентімен оңай шатастырылатын термин. Оның орнына талқылауды «көмекшілер» немесе «жүйе» төңірегінде жүргізіңіз. Біз пайдаланушылардың пайдалы автоматтандыру мен интрузивті басқару арасындағы шекараны қай жерде жүргізетінін анықтауымыз керек.

Әдіс: Пайдаланушылардан әртүрлі гипотетикалық сценарийлерде агентпен күтілетін өзара әрекеттесулерін сипаттауды, сурет салуды немесе баяндауды сұраңыз. Негізгі зондтар (әртүрлі салаларды көрсететін): Қажетті автоматтандырудың шекараларын және шамадан тыс автоматтандыруға қатысты ықтимал алаңдаушылықтарды түсіну үшін мынаны сұраңыз: Егер сіздің рейсіңіз тоқтатылса, жүйенің автоматты түрде не істегенін қалайсыз? Егер ол мұны сіздің нақты нұсқауыңызсыз жасаса, сізді не алаңдатады?

Пайдаланушының агенттің ішкі процестері мен қажетті байланысы туралы түсінігін зерттеу үшін мынаны сұраңыз: Сандық көмекші смарт үйіңізді басқарып жатқанын елестетіп көріңіз. Егер пакет жеткізілсе, ол қандай қадамдар жасайды деп ойлайсыз және сіз қандай ақпаратты алуды күтесіз?

Көп сатылы процесте бақылау мен келісімге қатысты күтулерді ашу үшін мынаны сұраңыз: Егер сіз цифрлық көмекшіңізден кездесуді жоспарлауды сұрасаңыз, ол қандай қадамдар жасайды деп ойлайсыз? Сізге қандай жағдайларда кеңес алғыңыз келеді немесе таңдауды қалайсыз?

Әдістің артықшылықтары: жасырын болжамдарды көрсетеді, агенттің жоспарланған әрекеті пайдаланушы күтулерінен ауытқуы мүмкін аймақтарды бөлектейді және сәйкес басқару элементтері мен кері байланыс механизмдерінің дизайнын хабарлайды.

Агенттік саяхат картасы: Дәстүрлі пайдаланушы саяхат картасына ұқсас, агент саяхат картасы пайдаланушының өзара әрекеттесуімен қатар, AI агентінің күтілетін әрекеттері мен шешім нүктелеріне ерекше назар аударады. Бұл ықтимал қателерді алдын ала анықтауға көмектеседі.

Әдіс: Агент жұмысының басталуынан аяқталуына дейінгі әртүрлі кезеңдерін, соның ішінде барлық ықтимал әрекеттерді, шешімдерді және сыртқы жүйелермен немесе пайдаланушылармен өзара әрекеттесуді сипаттайтын көрнекі карта жасаңыз. Картаның негізгі элементтері: Агент әрекеттері: агент қандай нақты тапсырмаларды немесе шешімдерді орындайды? Ақпараттық кірістер/шығыстар: агентке қандай деректер қажет және ол қандай ақпаратты жасайды немесе байланыстырады? Шешім қабылдау нүктелері: агент қай жерде таңдау жасайды және бұл таңдаудың критерийлері қандай? Пайдаланушы өзара әрекеттесу нүктелері: пайдаланушы енгізуді, қарауды немесе әрекеттерді қайда бекітеді? Сәтсіздік нүктелері: Ең бастысы, агент нұсқауларды дұрыс түсінбеуі, дұрыс емес шешім қабылдауы немесе дұрыс емес ұйыммен әрекеттесуі мүмкін нақты жағдайларды анықтаңыз. Мысалдар: қате алушы (мысалы, құпия ақпаратты қате адамға жіберу), овердрафт (мысалы, қолжетімді қаражаттан асатын автоматтандырылған төлем), ниетті қате түсіндіру (мысалы, түсініксіз тілге байланысты қате күнге рейске тапсырыс беру).

Қалпына келтіру жолдары: агент немесе пайдаланушы осы сәтсіздіктерден қалай қалпына келтіре алады? Түзету немесе араласу үшін қандай механизмдер бар?

Әдістің артықшылықтары: Агенттің операциялық ағынының тұтас көрінісін қамтамасыз етеді, жасырын тәуелділіктерді ашады және теріс нәтижелерді болдырмау немесе азайту үшін қауіпсіздік шараларын, қателерді өңдеуді және пайдаланушының араласу нүктелерін белсенді жобалауға мүмкіндік береді.

Тәртіпсіз мінез-құлық сынағы: Бұл әдіс жүйені стресс-тестілеуге және AI агенті сәтсіз болғанда немесе күткеннен ауытқыған кезде пайдаланушы реакцияларын бақылауға арналған. Бұл жағымсыз жағдайларда сенім мен эмоционалды жауаптарды түсіну туралы.

Әдіс: Бақыланатын зертханалық зерттеулерде агент қате жіберетін, пәрменді қате түсінетін немесе күтпеген әрекет ететін сценарийлерді әдейі енгізіңіз. Модельдеуге арналған «қате мінез-құлық» түрлері: ПәрменҚате түсіндірме: агент пайдаланушының ниетінен сәл өзгеше әрекетті орындайды (мысалы, бір элементтің орнына екі элементке тапсырыс беру). Ақпараттың шамадан тыс жүктелуі/төмен жүктелуі: агент тым көп маңызды емес ақпаратты береді немесе маңызды мәліметтер жеткіліксіз. Сұраныссыз әрекет: агент пайдаланушы нақты қаламаған немесе күтпеген әрекетті жасайды (мысалы, мақұлдаусыз акцияларды сатып алу). Жүйе қатесі: агент істен шығады, жауап бермейді немесе қате туралы хабарды береді. Этикалық дилеммалар: агент этикалық салдары бар шешім қабылдайды (мысалы, күтпеген көрсеткішке негізделген бір тапсырманы екіншісінен басымдылық).

Бақылау фокусы: Пайдаланушы реакциялары: пайдаланушылар эмоционалды түрде қалай әрекет етеді (ренжіту, ашулану, шатасу, сенім жоғалту)? Қалпына келтіру әрекеттері: пайдаланушылар агент әрекетін түзету немесе оның әрекеттерін болдырмау үшін қандай қадамдар жасайды? Сенімді жөндеу механизмдері: жүйенің кірістірілген қалпына келтіру немесе кері байланыс механизмдері сенімді қалпына келтіруге көмектесе ме? Пайдаланушылар қателер туралы қалай хабардар болғысы келеді? Психикалық үлгінің ауысуы: дұрыс емес мінез-құлық пайдаланушының агент мүмкіндіктері немесе шектеулері туралы түсінігін өзгерте ме?

Әдістің артықшылықтары: қателерді қалпына келтіруге, кері байланысқа және пайдаланушыны басқаруға қатысты дизайндағы кемшіліктерді анықтау үшін маңызды. Ол пайдаланушылардың агент сәтсіздігіне қаншалықты төзімді екенін және сенімдірек және кешірімді агенттік жүйелерге әкелетін сенімді сақтау немесе қайта құру үшін не қажет екендігі туралы түсінік береді.

Осы зерттеу әдістемелерін біріктіре отырып, UX тәжірибешілері агенттік жүйелерді оларды сенімді, басқарылатын және есеп беруге жарамды ету, пайдаланушылар мен олардың AI агенттері арасында оң және өнімді қарым-қатынасты дамыта алатындай етіп жасаумен шектелмейді. Бұл агенттік AI-ны тиімді зерттеуге қатысты жалғыз әдістер емес екенін ескеріңіз. Көптеген басқа әдістер бар, бірақ олар жақын арада тәжірибешілер үшін ең қолжетімді. Мен бұған дейін «Оз шебері» әдісін, тұжырымдаманы тексерудің біршама жетілдірілген әдісін қарастырдым, ол сонымен қатар агенттік AI тұжырымдамаларын зерттеудің құнды құралы болып табылады. Зерттеу әдістемесіндегі этикалық ойлар Агенттік AI-ны зерттеу кезінде, әсіресе дұрыс емес мінез-құлық немесе қателерді модельдеу кезінде, этикалық ойларды ескеру қажет. Этикалық UX зерттеулеріне назар аударатын көптеген жарияланымдар бар, соның ішінде мен Smashing журналына жазған мақалам, UX жобалау институтының осы нұсқаулары және инклюзивті дизайн құралдарының осы беті. Агенттік AI үшін негізгі көрсеткіштер Агенттік AI жүйелерінің өнімділігі мен сенімділігін тиімді бағалау үшін сізге негізгі көрсеткіштердің толық жиынтығы қажет болады. Бұл көрсеткіштер пайдаланушы сеніміне, жүйе дәлдігіне және жалпы пайдаланушы тәжірибесіне түсінік береді. Осы көрсеткіштерді бақылай отырып, әзірлеушілер мен дизайнерлер жақсартуды қажет ететін аймақтарды анықтап, AI агенттерінің қауіпсіз және тиімді жұмыс істеуін қамтамасыз ете алады. 1. Интервенция коэффициенті Автономды агенттер үшін табысты үнсіздікпен өлшейміз. Егер агент тапсырманы орындаса және пайдаланушы орнатылған терезеде (мысалы, 24 сағат) әрекетке араласпаса немесе кері қайтармаса, біз оны қабылданған деп санаймыз. Біз араласу жылдамдығын қадағалаймыз: адам агентті тоқтату немесе түзету үшін қаншалықты жиі секіреді? Интервенцияның жоғары жылдамдығы сенім немесе логикадағы сәйкессіздікті көрсетеді. 2. 1000 тапсырмаға арналған жоспарланбаған әрекеттердің жиілігі Бұл маңызды көрсеткіш 1000 орындалған тапсырма үшін қалыпқа келтірілген, пайдаланушы қаламаған немесе күтпеген AI агенті орындаған әрекеттердің санын анықтайды. Күтпеген әрекеттердің төмен жиілігі пайдаланушы ниетін дәл түсіндіретін және анықталған шекараларда жұмыс істейтін жақсы реттелген AI-ны білдіреді. Бұл көрсеткіш AI контекстті түсінуімен, оның командаларды ажырату қабілетімен және қауіпсіздік хаттамаларының беріктігімен тығыз байланысты. 3. Кері қайтару немесе қайтару бағалары Бұл көрсеткіш пайдаланушыларға AI орындаған әрекетті қайтару немесе қайтару қажет жиілігін қадағалайды. Жоғары кері қайтару жылдамдығы AI жиі қателер жібереді, нұсқауларды дұрыс түсінбейді немесе пайдаланушы күтулеріне сәйкес келмейтін әрекеттер жасайды. Бұл кері қайтарулардың себептерін талдау AI алгоритмдерін жақсарту, пайдаланушы қалауларын түсіну және оның қалаған нәтижелерді болжау қабілеті үшін құнды кері байланысты қамтамасыз етеді. Неліктен екенін түсіну үшін кері қайтару әрекетіне микро сауалнаманы орындау керек. Мысалы, пайдаланушы жоспарлауды өзгертуді өзгерткен кезде, қарапайым шақыру: "Уақыт дұрыс емес пе? Қате адам? Әлде мұны өзіңіз жасағыңыз келді ме?" Пайдаланушыға олардың пікіріне ең жақсы сәйкес келетін опцияны басуға мүмкіндік беру. 4. Қатеден кейінгі шешімге дейінгі уақыт Бұл көрсеткішпайдаланушыға AI жіберген қатені түзетуге немесе AI жүйесінің өзі қате күйден қалпына келтіруге кететін уақытты өлшейді. Ажыратымдылыққа дейінгі қысқа уақыт қателерді қалпына келтірудің тиімді және пайдаланушыға ыңғайлы процесін көрсетеді, ол пайдаланушының көңілсіздігін азайтып, өнімділікті сақтай алады. Бұған қатені анықтаудың қарапайымдылығы, қайтару немесе түзету механизмдерінің қолжетімділігі және АИ қамтамасыз ететін қате туралы хабарлардың анықтығы кіреді.

Бұл көрсеткіштерді жинау Агент әрекетінің идентификаторларын бақылау үшін жүйені құралмен қамтамасыз етуді қажет етеді. Кесте ұсыну немесе рейске тапсырыс беру сияқты агент жасайтын әрбір нақты әрекет журналдарда сақталатын бірегей идентификаторды жасауы керек. Интервенция жылдамдығын өлшеу үшін біз пайдаланушының бірден реакциясын іздемейміз. Біз анықталған терезеде қарсы әрекеттің жоқтығын іздейміз. Әрекет идентификаторы таңғы сағат 9:00-де жасалса және бірде-бір адам пайдаланушы осы нақты идентификаторды келесі күні сағат 9:00-ге дейін өзгертпесе немесе қайтармаса, жүйе оны логикалық түрде Қабылданған деп белгілейді. Бұл белсенді растауға емес, пайдаланушының үнсіздігіне негізделген табысты сандық бағалауға мүмкіндік береді. Қайтару тарифтері үшін өңделмеген сандар жеткіліксіз, себебі оларда контекст жоқ. Негізгі себепті анықтау үшін қолданбаңыздың Болдырмау немесе Қайтару функцияларында тоқтату логикасын енгізуіңіз керек. Пайдаланушы агент бастаған әрекетті кері қайтарған кезде, жеңіл микрозерттеуді іске қосыңыз. Бұл пайдаланушыдан қатені іс жүзінде дұрыс емес, контекст жоқ немесе тапсырманы қолмен өңдеуге арналған қарапайым қалау ретінде санаттауды сұрайтын қарапайым үш опциялы модаль болуы мүмкін. Бұл сандық телеметрияны сапалы түсінікпен біріктіреді. Ол инженерлік топтарға бұзылған алгоритм мен пайдаланушы қалауының сәйкессіздігін ажыратуға мүмкіндік береді. Бұл көрсеткіштер дәйекті түрде бақыланатын және тұтас талданған кезде, бақылау, келісім және есеп беруді үздіксіз жақсартуға мүмкіндік беретін агенттік AI жүйелерінің өнімділігін бағалау үшін сенімді негізді қамтамасыз етеді. Алдануға қарсы дизайн Агенттердің қабілеттілігі артқан сайын, біз жаңа қауіпке тап боламыз: Agentic Sludge. Дәстүрлі тұнба үйкеліс тудырады, бұл жазылымнан бас тартуды немесе есептік жазбаны жоюды қиындатады. Агентті тұнба керісінше әрекет етеді. Ол ақаулықтағы үйкелісті жояды, бұл пайдаланушының өз мүдделеріне емес, бизнеске пайда әкелетін әрекетке келісуін тым жеңілдетеді. Саяхатқа тапсырыс беруге көмектесетін агентті қарастырыңыз. Ашық қоршауларсыз жүйе серіктес әуе компаниясына немесе жоғары маржалық қонақүйге басымдық бере алады. Ол бұл таңдауды оңтайлы жол ретінде ұсынады. Жүйенің беделіне сенген пайдаланушы ұсынысты тексермей қабылдайды. Бұл жүйе ыңғайлылық желеуімен кірісті оңтайландыратын алдамшы үлгіні жасайды. Жалған елестетілген құзыреттілік тәуекелі Алдау зиянды ниеттен туындамауы мүмкін. Ол көбінесе AI-да елестетілген құзыреттілік ретінде көрінеді. Үлкен тілдік үлгілер қате болса да жиі беделді болып естіледі. Олар тексерілген факт сияқты сенімділікпен жалған брондау растамасын немесе дәл емес түйіндемені ұсынады. Пайдаланушылар бұл сенімді тонға табиғи түрде сенуі мүмкін. Бұл сәйкессіздік жүйе мүмкіндігі мен пайдаланушы күтулері арасында қауіпті алшақтық тудырады. Біз бұл олқылықты жою үшін арнайы жобалауымыз керек. Егер агент тапсырманы орындай алмаса, интерфейс бұл сәтсіздікті анық көрсетуі керек. Жүйе сенімсіз болса, оны жылтыратылған прозамен жасырмай, белгісіздікті білдіруі керек. Примитивтер арқылы мөлдірлік Шламға да, галлюцинацияға да қарсы дәрі – шығу тегі. Әрбір автономды әрекет шешімнің шығуын түсіндіретін арнайы метадеректер тегін талап етеді. Пайдаланушыларға нәтиженің артындағы логикалық тізбекті тексеру мүмкіндігі қажет. Бұған қол жеткізу үшін біз қарабайыр сөздерді практикалық жауаптарға аударуымыз керек. Бағдарламалық жасақтама инженериясында примитивтер ақпараттың негізгі бірліктеріне немесе агент орындайтын әрекеттерге сілтеме жасайды. Инженер үшін бұл API қоңырауы немесе логикалық қақпа сияқты көрінеді. Пайдаланушыға ол нақты түсініктеме ретінде көрінуі керек. Дизайн мәселесі осы техникалық қадамдарды адам оқи алатын негіздемелермен салыстыру болып табылады. Егер агент нақты рейсті ұсынса, пайдаланушы оның себебін білуі керек. Интерфейс жалпы ұсыныстың артына жасыра алмайды. Ол негізгі примитивті ашуы керек: Логика: Ең арзан_Тікелей_Ұшу немесе Логика: Серіктес_Әуе жолы_Басымдығы. 4-сурет осы аударма ағынын көрсетеді. Біз шикі жүйені қарабайыр — нақты код логикасын — алып, оны пайдаланушыға бағытталған жолға салыстырамыз. Мысалы, жиналыстың күнтізбелік кестесін қарапайым тексеру нақты мәлімдемеге айналады: мен сағат 16.00-ді ұсындым.кездесу. Бұл ашықтық деңгейі агент әрекеттерінің логикалық және пайдалы болып көрінуін қамтамасыз етеді. Ол пайдаланушыға агенттің олардың мүдделеріне сай әрекет еткенін тексеруге мүмкіндік береді. Қарапайым заттарды әшкерелей отырып, біз қара жәшікті шыны жәшікке айналдырып, пайдаланушылардың өздерінің цифрлық өміріндегі соңғы билік болып қалуын қамтамасыз етеміз.

Дизайн үшін сахнаны орнату Агенттік жүйені құру психологиялық және мінез-құлық түсінігінің жаңа деңгейін талап етеді. Ол бізді кәдімгі жарамдылық тестілеуінен шығып, сенім, келісім және есеп беру саласына көшуге мәжбүр етеді. Біз талқылаған зерттеу әдістері, психикалық үлгілерді зерттеуден бастап, тәртіпсіздікті имитациялауға және жаңа көрсеткіштерді орнатуға дейін қажетті негіз береді. Бұл тәжірибелер автономды жүйенің қай жерде сәтсіздікке ұшырауы мүмкін екенін және одан да маңыздысы ол кезде пайдаланушы-агент қатынасын қалай жөндеуге болатынын алдын ала анықтаудың маңызды құралдары болып табылады. Агенттік AI-ға ауысу пайдаланушы мен жүйе қарым-қатынасын қайта анықтау болып табылады. Біз енді командаларға жауап беретін құралдарды құрастырмаймыз; біз өз атымыздан әрекет ететін серіктестер үшін жобалаймыз. Бұл дизайн императивін тиімділік пен пайдаланудың қарапайымдылығынан ашықтыққа, болжамдылыққа және бақылауға дейін өзгертеді. AI соңғы рет басусыз рейске тапсырыс бере алатын немесе акцияларды саудалай алатын болса, оның «пандустардағы» және «пандустан тыс» дизайны маңызды болады. Пайдаланушылардың тіпті рульді тапсырған кезде де өзін жүргізуші орнында сезінуін қамтамасыз ету біздің міндетіміз. Бұл жаңа шындық UX зерттеушісінің рөлін де арттырады. Біз агент автономиясының қоршауларын анықтау және сынау үшін инженерлермен және өнім менеджерлерімен бірлесіп жұмыс істей отырып, пайдаланушы сенімінің сақтаушылары боламыз. Зерттеуші болудан басқа, біз әзірлеу үдерісіндегі пайдаланушыларды бақылау, ашықтық және этикалық қауіпсіздік шараларын қорғаушылар боламыз. Қарапайым сөздерді практикалық сұрақтарға аудару және ең нашар сценарийлерді модельдеу арқылы біз қуатты және қауіпсіз сенімді жүйелер құра аламыз. Бұл мақалада агенттік AI-ны зерттеудің «не» және «неге» сипатталған. Бұл біздің дәстүрлі құралдардың жеткіліксіз екенін және жаңа, болашаққа бағытталған әдістемелерді қабылдауымыз керектігін көрсетті. Келесі мақала осы негізге негізделіп, агенттің қызметтік бағдарламасын пайдаланушылар үшін мөлдір ететін арнайы дизайн үлгілері мен ұйымдастырушылық тәжірибелермен қамтамасыз етіп, олардың агенттік AI күшін сенімділікпен және бақылаумен пайдалана алатынын қамтамасыз етеді. UX болашағы - бұл жүйелерді сенімді ету. Агенттік AI туралы қосымша түсінік алу үшін келесі ресурстарды зерттеуге болады:

Agentic AI жүйесіндегі Google AI блогы Microsoft компаниясының AI агенттері туралы зерттеулері

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free