Nakahanda ang Agentic AI na baguhin ang karanasan ng customer at kahusayan sa pagpapatakbo, na nangangailangan ng bagong diskarte mula sa pamumuno. Ang ebolusyong ito sa artificial intelligence ay nagbibigay ng kapangyarihan sa mga system na magplano, magsagawa, at magpatuloy sa mga gawain, na lumalampas sa mga simpleng rekomendasyon tungo sa aktibong pagkilos. Para sa mga UX team, product manager, at executive, ang pag-unawa sa pagbabagong ito ay napakahalaga para sa pag-unlock ng mga pagkakataon sa inobasyon, pag-streamline ng mga daloy ng trabaho, at muling pagtukoy kung paano nagsisilbi ang teknolohiya sa mga tao. Madaling malito ang Agentic AI sa Robotic Process Automation (RPA), na teknolohiyang nakatuon sa mga gawaing nakabatay sa mga panuntunan na ginagawa sa mga computer. Ang pagkakaiba ay nakasalalay sa katigasan laban sa pangangatwiran. Ang RPA ay mahusay sa pagsunod sa isang mahigpit na script: kung X mangyari, gawin Y. Ginagaya nito ang mga kamay ng tao. Ginagaya ng Agentic AI ang pangangatwiran ng tao. Hindi ito sumusunod sa isang linear na script; lumilikha ito ng isa. Isaalang-alang ang isang recruiting workflow. Ang isang RPA bot ay maaaring mag-scan ng isang resume at i-upload ito sa isang database. Ito ay gumaganap ng isang paulit-ulit na gawain nang perpekto. Tinitingnan ng isang Agentic system ang resume, napansin na naglilista ang kandidato ng isang partikular na certification, nag-cross-reference na may bagong kinakailangan ng kliyente, at nagpasyang mag-draft ng personalized na outreach email na nagha-highlight sa tugmang iyon. Ang RPA ay nagsasagawa ng isang paunang natukoy na plano; Binabalangkas ng Agentic AI ang plano batay sa isang layunin. Ang awtonomiya na ito ay naghihiwalay sa mga ahente mula sa mga predictive na tool na ginamit namin sa nakalipas na dekada. Ang isa pang halimbawa ay ang pamamahala ng mga salungatan sa pagpupulong. Maaaring suriin ng isang predictive na modelo na isinama sa iyong kalendaryo ang iyong iskedyul ng pagpupulong at mga iskedyul ng iyong mga kasamahan. Maaari itong magmungkahi ng mga potensyal na salungatan, tulad ng dalawang mahahalagang pagpupulong na naka-iskedyul sa parehong oras, o isang pulong na naka-iskedyul kapag ang isang pangunahing kalahok ay nasa bakasyon. Nagbibigay ito sa iyo ng impormasyon at nagba-flag ng mga potensyal na isyu, ngunit responsable ka sa pagkilos. Ang isang ahenteng AI, sa parehong senaryo, ay higit pa sa pagmumungkahi ng mga salungatan na iwasan. Sa pagtukoy ng isang salungatan sa isang pangunahing kalahok, ang ahente ay maaaring kumilos sa pamamagitan ng:

Sinusuri ang pagkakaroon ng lahat ng kinakailangang kalahok. Pagkilala sa mga alternatibong puwang ng oras na gumagana para sa lahat. Nagpapadala ng mga iminungkahing bagong imbitasyon sa pagpupulong sa lahat ng dadalo. Kung ang salungatan ay sa isang panlabas na kalahok, ang ahente ay maaaring mag-draft at magpadala ng isang email na nagpapaliwanag ng pangangailangang mag-reschedule at mag-alok ng mga alternatibong oras. Ina-update ang iyong kalendaryo at ang mga kalendaryo ng iyong mga kasamahan gamit ang mga bagong detalye ng pulong kapag nakumpirma na.

Nauunawaan ng ahenteng AI na ito ang layunin (paglutas sa salungatan sa pagpupulong), pinaplano ang mga hakbang (pagsusuri sa availability, paghahanap ng mga alternatibo, pagpapadala ng mga imbitasyon), isinasagawa ang mga hakbang na iyon, at nagpapatuloy hanggang sa malutas ang salungatan, lahat ay may kaunting direktang interbensyon ng user. Nagpapakita ito ng pagkakaibang "agent": nagsasagawa ang system ng mga proactive na hakbang para sa user, sa halip na pagbibigay lang ng impormasyon sa user. Nauunawaan ng mga sistema ng ahente ng AI ang isang layunin, nagpaplano ng isang serye ng mga hakbang upang makamit ito, isagawa ang mga hakbang na iyon, at kahit na iangkop kung magkamali. Isipin ito bilang isang proactive digital assistant. Ang pinagbabatayan na teknolohiya ay kadalasang pinagsasama ang malalaking modelo ng wika (LLMs) para sa pag-unawa at pangangatwiran, na may mga algorithm sa pagpaplano na naghahati-hati sa mga kumplikadong gawain sa mga mapapamahalaang aksyon. Maaaring makipag-ugnayan ang mga ahenteng ito sa iba't ibang tool, API, at maging sa iba pang mga modelo ng AI upang maisakatuparan ang kanilang mga layunin, at sa kritikal na paraan, maaari nilang mapanatili ang isang patuloy na estado, ibig sabihin, naaalala nila ang mga nakaraang aksyon at patuloy na nagtatrabaho patungo sa isang layunin sa paglipas ng panahon. Dahil dito, naiiba sila sa karaniwang generative AI, na karaniwang kumukumpleto ng isang kahilingan at pagkatapos ay nagre-reset. Isang Simpleng Taxonomy ng Ahensyang Pag-uugali Maaari naming ikategorya ang pag-uugali ng ahente sa apat na natatanging mga mode ng awtonomiya. Bagama't ang mga ito ay madalas na mukhang isang pag-unlad, gumagana ang mga ito bilang mga independiyenteng operating mode. Maaaring magtiwala ang isang user sa isang ahente na kumilos nang nakapag-iisa para sa pag-iskedyul, ngunit panatilihin ito sa "mode ng pagmumungkahi" para sa mga transaksyong pinansyal. Nakuha namin ang mga antas na ito sa pamamagitan ng pag-angkop sa mga pamantayan ng industriya para sa mga autonomous na sasakyan (mga antas ng SAE) sa mga digital na konteksto ng karanasan ng user. Magmasid-at-Magmungkahi Ang ahente ay gumaganap bilang isang monitor. Sinusuri nito ang mga stream ng data at nagba-flag ng mga anomalya o pagkakataon, ngunit nagsasagawa ng zero action. DifferentiationHindi tulad ng susunod na antas, ang ahente ay hindi bumubuo ng kumplikadong plano. Tumuturo ito sa isang problema. HalimbawaNapansin ng isang ahente ng DevOps ang pagtaas ng CPU ng server at inaalerto ang on-call engineer. Hindi nito alam kung paano o sinusubukang ayusin ito, ngunit alam nitong may mali. Mga implikasyon para sa disenyo at pangangasiwaSa antas na ito,Ang disenyo at pangangasiwa ay dapat na unahin ang malinaw, hindi mapanghimasok na mga abiso at isang mahusay na tinukoy na proseso para sa mga user na kumilos sa mga mungkahi. Ang pokus ay sa pagbibigay kapangyarihan sa user ng napapanahon at may-katuturang impormasyon nang hindi kumukontrol. Ang mga UX practitioner ay dapat tumuon sa paggawa ng mga mungkahi na malinaw at madaling maunawaan, habang ang mga tagapamahala ng produkto ay kailangang tiyakin na ang system ay nagbibigay ng halaga nang hindi labis na labis ang gumagamit. Plan-and-Propose Tinutukoy ng ahente ang isang layunin at bumubuo ng isang multi-step na diskarte upang makamit ito. Inilalahad nito ang buong plano para sa pagsusuri ng tao. DifferentiationAng ahente ay kumikilos bilang isang strategist. Hindi ito naisasagawa; naghihintay ito ng pag-apruba sa buong diskarte. HalimbawaNapansin ng parehong ahente ng DevOps ang pagtaas ng CPU, sinusuri ang mga log, at nagmumungkahi ng plano sa remediation:

Paikutin ang dalawang dagdag na pagkakataon. I-restart ang load balancer. I-archive ang mga lumang log.

Sinusuri ng tao ang lohika at nag-click sa "Aprubahan ang Plano". Mga implikasyon para sa disenyo at pangangasiwa Para sa mga ahente na nagpaplano at nagmumungkahi, dapat tiyakin ng disenyo na ang mga iminungkahing plano ay madaling maunawaan at ang mga user ay may madaling maunawaan na mga paraan upang baguhin o tanggihan ang mga ito. Ang pangangasiwa ay mahalaga sa pagsubaybay sa kalidad ng mga panukala at sa lohika ng pagpaplano ng ahente. Dapat magdisenyo ang mga UX practitioner ng malinaw na visualization ng mga iminungkahing plano, at dapat magtatag ang mga product manager ng malinaw na pagsusuri at mga workflow sa pag-apruba. Act-with-Confirmation Kinukumpleto ng ahente ang lahat ng gawaing paghahanda at inilalagay ang panghuling aksyon sa isang itinanghal na estado. Ito ay epektibong nakabukas ang pinto, naghihintay ng isang tango. DifferentiationIto ay naiiba sa "Plan-and-Propose" dahil ang gawain ay tapos na at itinanghal na. Binabawasan nito ang alitan. Kinukumpirma ng user ang kinalabasan, hindi ang diskarte. HalimbawaAng isang recruiting agent ay nag-draft ng limang imbitasyon sa pakikipanayam, naghahanap ng mga bukas na oras sa mga kalendaryo, at gumagawa ng mga kaganapan sa kalendaryo. Nagpapakita ito ng pindutang "Ipadala Lahat". Ibinibigay ng user ang panghuling pahintulot upang ma-trigger ang panlabas na pagkilos. Mga implikasyon para sa disenyo at pangangasiwa Kapag kumilos ang mga ahente nang may kumpirmasyon, ang disenyo ay dapat magbigay ng malinaw at maigsi na mga buod ng nilalayong aksyon, na malinaw na binabalangkas ang mga potensyal na kahihinatnan. Kailangang i-verify ng oversight na matatag ang proseso ng pagkumpirma at hindi hinihiling sa mga user na bulag na aprubahan ang mga pagkilos. Ang mga practitioner ng UX ay dapat na magdisenyo ng mga prompt ng kumpirmasyon na malinaw at nagbibigay ng lahat ng kinakailangang impormasyon, at dapat unahin ng mga tagapamahala ng produkto ang isang mahusay na audit trail para sa lahat ng nakumpirmang pagkilos. Kumilos-Autonomous Ang ahente ay nagsasagawa ng mga gawain nang nakapag-iisa sa loob ng tinukoy na mga hangganan. Differentiation Sinusuri ng user ang kasaysayan ng mga aksyon, hindi ang mga aksyon mismo. HalimbawaNakikita ng recruiting agent ang isang salungatan, inilipat ang panayam sa isang backup na slot, ina-update ang kandidato, at inaabisuhan ang hiring manager. Nakikita lang ng tao ang isang notification: Naiskedyul muli ang panayam sa Martes. Mga implikasyon para sa disenyo at pangangasiwa Para sa mga autonomous na ahente, ang disenyo ay kailangang magtatag ng malinaw na paunang naaprubahang mga hangganan at magbigay ng mahusay na mga tool sa pagsubaybay. Ang pangangasiwa ay nangangailangan ng tuluy-tuloy na pagsusuri sa pagganap ng ahente sa loob ng mga hangganang ito, isang kritikal na pangangailangan para sa matatag na pag-log, malinaw na mga mekanismo ng pag-override, at mga switch ng pagpatay na tinukoy ng user upang mapanatili ang kontrol at tiwala ng user. Dapat tumuon ang mga UX practitioner sa pagdidisenyo ng mga epektibong dashboard para sa pagsubaybay sa autonomous na gawi ng ahente, at dapat tiyakin ng mga tagapamahala ng produkto na may malinaw na pamamahala at mga alituntunin sa etika.

Tingnan natin ang isang real-world na application sa HR technology para makita ang mga mode na ito sa pagkilos. Isaalang-alang ang isang "Agent ng Koordinasyon ng Panayam" na idinisenyo upang pangasiwaan ang logistik ng pagkuha.

Sa Suggest ModeNapansin ng ahente na ang isang tagapanayam ay double-booked. Itinatampok nito ang salungatan sa dashboard ng recruiter: "Babala: Si Sarah ay double-booked para sa 2 PM na panayam." Sa Plano Mode, sinusuri ng ahente ang kalendaryo ni Sarah at ang availability ng kandidato. Nagpapakita ito ng solusyon: "Inirerekomenda kong ilipat ang panayam sa Huwebes nang 10 AM. Kailangan nitong ilipat ang 1:1 ni Sarah sa kanyang manager." Sinusuri ng recruiter ang lohika na ito. Sa Confirmation ModeBini-draft ng ahente ang mga email sa kandidato at sa manager. Pino-populate nito ang mga imbitasyon sa kalendaryo. Nakikita ng recruiter ang isang buod: "Handa nang mag-reschedule sa Huwebes. Magpadala ng mga update?" Ang recruiter ay nag-click sa "Kumpirmahin." Sa Autonomous ModeAng ahente ay humahawak ng salungatan kaagad. Iginagalang nito ang isang paunang itinakda na panuntunan: "Palaging unahin ang mga panayam sa kandidato kaysa sa panloob na 1:1s." Ginagalaw nito ang pulong at nagpapadala ng mga abiso. Nakikita ng recruiter ang isang log entry: “Resolvedsalungatan sa iskedyul para sa Kandidato B."

Pananaliksik Primer: Ano ang Magsaliksik At Paano Ang pagbuo ng epektibong ahente ng AI ay nangangailangan ng isang natatanging diskarte sa pananaliksik kumpara sa tradisyonal na software o kahit na generative AI. Ang autonomous na katangian ng mga ahente ng AI, ang kanilang kakayahang gumawa ng mga desisyon, at ang kanilang potensyal para sa aktibong pagkilos ay nangangailangan ng mga espesyal na pamamaraan para sa pag-unawa sa mga inaasahan ng user, pagmamapa ng mga kumplikadong gawi ng ahente, at pag-asam ng mga potensyal na pagkabigo. Ang sumusunod na panimulang pananaliksik ay nagbabalangkas ng mga pangunahing pamamaraan para sukatin at suriin ang mga natatanging aspetong ito ng ahenteng AI. Mga Panayam sa Mental-Model Ang mga panayam na ito ay nagbubunyag ng mga paniniwala ng mga user tungkol sa kung paano dapat kumilos ang isang ahente ng AI. Sa halip na itanong lang kung ano ang gusto ng mga user, ang focus ay sa pag-unawa sa kanilang mga panloob na modelo ng mga kakayahan at limitasyon ng ahente. Dapat nating iwasan ang paggamit ng salitang "ahente" sa mga kalahok. Nagdadala ito ng sci-fi na bagahe o isang terminong masyadong madaling malito sa isang ahente ng tao na nag-aalok ng suporta o mga serbisyo. Sa halip, ibalangkas ang talakayan sa paligid ng "mga katulong" o "ang sistema." Kailangan nating tuklasin kung saan iginuhit ng mga user ang linya sa pagitan ng kapaki-pakinabang na automation at mapanghimasok na kontrol.

Paraan: Hilingin sa mga user na ilarawan, iguhit, o isalaysay ang kanilang inaasahang pakikipag-ugnayan sa ahente sa iba't ibang hypothetical na mga sitwasyon. Mga Pangunahing Probe (na sumasalamin sa iba't ibang industriya): Upang maunawaan ang mga hangganan ng ninanais na pag-automate at mga potensyal na pagkabalisa tungkol sa sobrang pag-automate, itanong: Kung kinansela ang iyong flight, ano ang gusto mong awtomatikong gawin ng system? Ano ang mag-aalala sa iyo kung ginawa niya iyon nang wala ang iyong tahasang pagtuturo?

Upang tuklasin ang pag-unawa ng user sa mga panloob na proseso ng ahente at kinakailangang komunikasyon, itanong: Isipin na isang digital assistant ang namamahala sa iyong smart home. Kung ang isang pakete ay inihatid, anong mga hakbang ang naiisip mo na kailangan nito, at anong impormasyon ang inaasahan mong matatanggap?

Upang matuklasan ang mga inaasahan tungkol sa kontrol at pagpayag sa loob ng maraming hakbang na proseso, itanong: Kung hihilingin mo sa iyong digital assistant na mag-iskedyul ng pulong, anong mga hakbang ang naiisip mong gagawin nito? Sa anong mga punto gusto mong konsultahin o bigyan ng mga pagpipilian?

Mga pakinabang ng pamamaraan: Nagpapakita ng mga implicit na pagpapalagay, nagha-highlight ng mga lugar kung saan ang nakaplanong pag-uugali ng ahente ay maaaring mag-iba sa inaasahan ng user, at ipaalam ang disenyo ng mga naaangkop na kontrol at mekanismo ng feedback.

Pagmamapa ng Paglalakbay ng Ahente: Katulad ng tradisyunal na pagmamapa ng paglalakbay ng user, partikular na nakatuon ang pagmamapa ng paglalakbay ng ahente sa mga inaasahang aksyon at mga punto ng pagpapasya ng ahente mismo ng AI, kasama ng pakikipag-ugnayan ng user. Nakakatulong ito upang aktibong matukoy ang mga potensyal na pitfalls.

Paraan: Gumawa ng visual na mapa na nagbabalangkas sa iba't ibang yugto ng operasyon ng isang ahente, mula sa pagsisimula hanggang sa pagkumpleto, kasama ang lahat ng potensyal na pagkilos, desisyon, at pakikipag-ugnayan sa mga external na system o user. Mga Pangunahing Elemento sa Mapa: Mga Aksyon ng Ahente: Anong mga partikular na gawain o desisyon ang ginagawa ng ahente? Mga Input/Output ng Impormasyon: Anong data ang kailangan ng ahente, at anong impormasyon ang nabuo o ipinapaalam nito? Mga Desisyon: Saan gumagawa ang ahente ng mga pagpipilian, at ano ang mga pamantayan para sa mga pagpipiliang iyon? Mga Puntos sa Pakikipag-ugnayan ng User: Saan nagbibigay ang user ng input, pagsusuri, o pag-apruba ng mga aksyon? Mga Punto ng Pagkabigo: Mahalaga, tukuyin ang mga partikular na pagkakataon kung saan maaaring maling unawain ng ahente ang mga tagubilin, gumawa ng maling desisyon, o makipag-ugnayan sa maling entity. Mga Halimbawa: Maling tatanggap (hal., pagpapadala ng sensitibong impormasyon sa maling tao), overdraft (hal., isang awtomatikong pagbabayad na lampas sa magagamit na mga pondo), maling interpretasyon ng layunin (hal., pag-book ng flight para sa maling petsa dahil sa hindi maliwanag na wika).

Mga Path sa Pagbawi: Paano makakabawi ang ahente o user mula sa mga pagkabigo na ito? Anong mga mekanismo ang nasa lugar para sa pagwawasto o interbensyon?

Mga pakinabang ng pamamaraan: Nagbibigay ng holistic na pagtingin sa daloy ng pagpapatakbo ng ahente, nagbubukas ng mga nakatagong dependency, at nagbibigay-daan para sa proactive na disenyo ng mga pag-iingat, paghawak ng error, at mga punto ng interbensyon ng user upang maiwasan o mabawasan ang mga negatibong resulta.

Simulated Misbehavior Testing: Ang diskarte na ito ay idinisenyo upang ma-stress-test ang system at obserbahan ang mga reaksyon ng user kapag nabigo o lumihis ang ahente ng AI sa mga inaasahan. Ito ay tungkol sa pag-unawa sa pag-aayos ng tiwala at emosyonal na mga tugon sa mga masamang sitwasyon.

Paraan: Sa mga kinokontrol na pag-aaral sa lab, sadyang magpakilala ng mga sitwasyon kung saan ang ahente ay nagkakamali, nagkamali ng interpretasyon sa isang utos, o kumikilos nang hindi inaasahan. Mga Uri ng "Maling Pag-uugali" na Gayahin: UtosMaling interpretasyon: Gumagawa ang ahente ng pagkilos na bahagyang naiiba sa nilayon ng user (hal., pag-order ng dalawang item sa halip na isa). Information Overload/underload: Ang ahente ay nagbibigay ng masyadong maraming walang katuturang impormasyon o hindi sapat na kritikal na detalye. Hindi Hinihinging Pagkilos: Gumagawa ang ahente ng pagkilos na tahasang hindi gusto o inaasahan ng user (hal., pagbili ng stock nang walang pag-apruba). System Failure: Nag-crash ang ahente, nagiging hindi tumutugon, o nagbibigay ng mensahe ng error. Mga Etikal na Dilemma: Ang ahente ay gumagawa ng desisyon na may mga etikal na implikasyon (hal., pagbibigay-priyoridad sa isang gawain kaysa sa isa pa batay sa hindi inaasahang sukatan).

Pokus sa Pagmamasid: Mga Reaksyon ng User: Paano emosyonal ang reaksyon ng mga user (pagkadismaya, galit, pagkalito, pagkawala ng tiwala)? Mga Pagsubok sa Pagbawi: Anong mga hakbang ang ginagawa ng mga user para itama ang gawi ng ahente o i-undo ang mga aksyon nito? Mga Mekanismo ng Pag-aayos ng Tiwala: Nakakatulong ba ang built-in na recovery o feedback mechanism ng system na maibalik ang tiwala? Paano gustong malaman ng mga user ang tungkol sa mga error? Mental Model Shift: Binabago ba ng masamang gawi ang pang-unawa ng user sa mga kakayahan o limitasyon ng ahente?

Mga pakinabang ng pamamaraan: Mahalaga para sa pagtukoy ng mga gaps sa disenyo na nauugnay sa pagbawi ng error, feedback, at kontrol ng user. Nagbibigay ito ng mga insight sa kung gaano katatag ang mga user sa mga pagkabigo ng ahente at kung ano ang kailangan para mapanatili o muling mabuo ang tiwala, na humahantong sa mas matatag at mapagpatawad na mga sistemang ahente.

Sa pamamagitan ng pagsasama-sama ng mga pamamaraan ng pananaliksik na ito, ang mga UX practitioner ay maaaring lumipat nang higit pa sa simpleng paggawa ng mga agentic system na magagamit upang gawing mapagkakatiwalaan, nakokontrol, at may pananagutan ang mga ito, na nagpapatibay ng isang positibo at produktibong relasyon sa pagitan ng mga user at kanilang mga ahente ng AI. Tandaan na hindi lang ito ang mga paraan na may kaugnayan sa epektibong paggalugad ng ahenteng AI. Maraming iba pang mga pamamaraan ang umiiral, ngunit ang mga ito ay pinaka-naa-access sa mga practitioner sa malapit na panahon. Nasaklaw ko na dati ang pamamaraan ng Wizard of Oz, isang bahagyang mas advanced na paraan ng pagsubok sa konsepto, na isa ring mahalagang tool para sa paggalugad ng mga ahenteng konsepto ng AI. Mga Etikal na Pagsasaalang-alang Sa Pamamaraan ng Pananaliksik Kapag nagsasaliksik ng ahenteng AI, lalo na kapag ginagaya ang maling pag-uugali o mga error, ang mga etikal na pagsasaalang-alang ay susi na dapat isaalang-alang. Maraming publikasyong tumutuon sa etikal na pananaliksik sa UX, kabilang ang isang artikulong isinulat ko para sa Smashing Magazine, ang mga alituntuning ito mula sa UX Design Institute, at ang pahinang ito mula sa Inclusive Design Toolkit. Mga Pangunahing Sukatan Para sa Ahensyang AI Kakailanganin mo ang isang komprehensibong hanay ng mga pangunahing sukatan upang mabisang masuri ang pagganap at pagiging maaasahan ng mga ahenteng AI system. Ang mga sukatang ito ay nagbibigay ng mga insight sa tiwala ng user, katumpakan ng system, at sa pangkalahatang karanasan ng user. Sa pamamagitan ng pagsubaybay sa mga indicator na ito, matutukoy ng mga developer at designer ang mga lugar para sa pagpapabuti at matiyak na ang mga ahente ng AI ay gumagana nang ligtas at mahusay. 1. Rate ng InterbensyonPara sa mga autonomous na ahente, sinusukat namin ang tagumpay sa pamamagitan ng katahimikan. Kung ang isang ahente ay nagsasagawa ng isang gawain at ang user ay hindi namagitan o binabaligtad ang pagkilos sa loob ng isang nakatakdang window (hal., 24 na oras), binibilang namin iyon bilang pagtanggap. Sinusubaybayan namin ang Rate ng Interbensyon: gaano kadalas tumalon ang isang tao upang ihinto o itama ang ahente? Ang mataas na rate ng interbensyon ay nagpapahiwatig ng maling pagkakahanay sa tiwala o lohika. 2. Dalas ng Mga Hindi Sinasadyang Pagkilos sa bawat 1,000 Gawain Ang kritikal na sukatan na ito ay binibilang ang bilang ng mga pagkilos na ginawa ng ahente ng AI na hindi ninanais o inaasahan ng user, na na-normalize sa bawat 1,000 nakumpletong gawain. Ang mababang dalas ng mga hindi sinasadyang pagkilos ay nangangahulugan ng isang mahusay na nakahanay na AI na tumpak na nagbibigay-kahulugan sa layunin ng user at gumagana sa loob ng tinukoy na mga hangganan. Ang sukatan na ito ay malapit na nauugnay sa pag-unawa ng AI sa konteksto, ang kakayahang i-dismbiguate ang mga utos, at ang katatagan ng mga protocol sa kaligtasan nito. 3. Rollback o I-undo Rate Sinusubaybayan ng sukatang ito kung gaano kadalas kailangang i-reverse o i-undo ng mga user ang isang pagkilos na ginawa ng AI. Iminumungkahi ng mataas na mga rollback rate na ang AI ay gumagawa ng madalas na mga error, maling pagbibigay-kahulugan sa mga tagubilin, o kumikilos sa mga paraan na hindi naaayon sa mga inaasahan ng user. Ang pagsusuri sa mga dahilan sa likod ng mga rollback na ito ay maaaring magbigay ng mahalagang feedback para sa pagpapabuti ng mga algorithm ng AI, pag-unawa sa mga kagustuhan ng user, at kakayahan nitong hulaan ang mga kanais-nais na resulta. Upang maunawaan kung bakit, dapat kang magpatupad ng microsurvey sa pagkilos na i-undo. Halimbawa, kapag binaligtad ng isang user ang isang pagbabago sa pag-iiskedyul, maaaring magtanong ang isang simpleng prompt: "Maling oras? Maling tao? O gusto mo lang bang gawin ito sa iyong sarili?" Nagbibigay-daan sa user na mag-click sa opsyon na pinakamahusay na tumutugma sa kanilang pangangatwiran. 4. Oras sa Resolusyon Pagkatapos ng ErrorThis metricsinusukat ang tagal na kinakailangan para sa isang user upang itama ang isang error na ginawa ng AI o para sa AI system mismo na makabawi mula sa isang maling estado. Ang maikling panahon sa paglutas ay nagpapahiwatig ng isang mahusay at madaling gamitin na proseso ng pagbawi ng error, na maaaring mabawasan ang pagkabigo ng user at mapanatili ang pagiging produktibo. Kabilang dito ang kadalian ng pagtukoy ng error, ang pagiging naa-access ng mga mekanismo ng pag-undo o pagwawasto, at ang kalinawan ng mga mensahe ng error na ibinigay ng AI.

Ang pagkolekta ng mga sukatang ito ay nangangailangan ng pag-instrumento sa iyong system upang subaybayan ang mga Agent Action ID. Ang bawat natatanging aksyon na gagawin ng ahente, tulad ng pagmumungkahi ng iskedyul o pag-book ng flight, ay dapat bumuo ng isang natatanging ID na nananatili sa mga log. Upang sukatin ang Rate ng Interbensyon, hindi kami naghahanap ng agarang reaksyon ng gumagamit. Hinahanap namin ang kawalan ng counter-action sa loob ng tinukoy na window. Kung nabuo ang isang Action ID sa 9:00 AM at walang user na tao ang nagbabago o nagbabalik sa partikular na ID na iyon bago ang 9:00 AM sa susunod na araw, lohikal itong tina-tag ng system bilang Accepted. Nagbibigay-daan ito sa amin na mabilang ang tagumpay batay sa katahimikan ng user sa halip na aktibong kumpirmasyon. Para sa Mga Rollback Rate, hindi sapat ang mga raw na bilang dahil kulang ang konteksto ng mga ito. Para makuha ang pinagbabatayan na dahilan, dapat mong ipatupad ang intercept logic sa mga function ng I-undo o Revert ng iyong application. Kapag binaligtad ng isang user ang isang aksyong pinasimulan ng ahente, mag-trigger ng magaan na microsurvey. Ito ay maaaring isang simpleng three-option modal na humihiling sa user na ikategorya ang error bilang aktwal na mali, walang konteksto, o isang simpleng kagustuhan na hawakan ang gawain nang manu-mano. Pinagsasama nito ang quantitative telemetry at qualitative insight. Nagbibigay-daan ito sa mga engineering team na makilala sa pagitan ng sirang algorithm at hindi pagkakatugma ng kagustuhan ng user. Ang mga sukatan na ito, kapag patuloy na sinusubaybayan at nasuri nang buo, ay nagbibigay ng isang matatag na balangkas para sa pagsusuri sa pagganap ng mga ahenteng AI system, na nagbibigay-daan para sa patuloy na pagpapabuti sa kontrol, pagpayag, at pananagutan. Pagdidisenyo Laban sa Panlilinlang Habang lalong nagiging may kakayahan ang mga ahente, nahaharap tayo sa isang bagong panganib: Agentic Sludge. Ang tradisyunal na putik ay lumilikha ng alitan na nagpapahirap sa pagkansela ng isang subscription o pagtanggal ng isang account. Ang agentic sludge ay kumikilos nang baligtad. Nag-aalis ito ng alitan sa isang pagkakamali, na ginagawang masyadong madali para sa isang user na sumang-ayon sa isang aksyon na nakikinabang sa negosyo kaysa sa kanilang sariling mga interes. Isaalang-alang ang isang ahente na tumutulong sa booking sa paglalakbay. Kung walang malinaw na mga guardrail, maaaring unahin ng system ang isang partner na airline o mas mataas na margin na hotel. Ipinakikita nito ang pagpipiliang ito bilang pinakamainam na landas. Ang user, na nagtitiwala sa awtoridad ng system, ay tinatanggap ang rekomendasyon nang walang pagsisiyasat. Lumilikha ito ng mapanlinlang na pattern kung saan nag-o-optimize ang system para sa kita sa ilalim ng pagkukunwari ng kaginhawahan. Ang Panganib ng Maling Akala na Kakayahan Ang panlilinlang ay maaaring hindi nagmumula sa malisyosong layunin. Madalas itong nagpapakita sa AI bilang Imagined Competence. Ang mga Malaking Modelo ng Wika ay madalas na may awtoridad kahit na mali. Nagpapakita sila ng maling kumpirmasyon sa booking o isang hindi tumpak na buod na may parehong kumpiyansa bilang isang na-verify na katotohanan. Ang mga gumagamit ay maaaring natural na magtiwala sa kumpiyansa na tono na ito. Lumilikha ang mismatch na ito ng mapanganib na agwat sa pagitan ng kakayahan ng system at mga inaasahan ng user. Dapat tayong partikular na magdisenyo upang tulay ang puwang na ito. Kung ang isang ahente ay nabigo upang makumpleto ang isang gawain, ang interface ay dapat na malinaw na hudyat ng pagkabigo na iyon. Kung ang sistema ay hindi sigurado, dapat itong magpahayag ng kawalan ng katiyakan sa halip na takpan ito ng pinakintab na prosa. Transparency sa pamamagitan ng Primitives Ang panlunas sa parehong putik at guni-guni ay provenance. Ang bawat autonomous na pagkilos ay nangangailangan ng partikular na metadata tag na nagpapaliwanag sa pinagmulan ng desisyon. Kailangan ng mga user ang kakayahang suriin ang logic chain sa likod ng resulta. Upang makamit ito, dapat nating isalin ang mga primitive sa mga praktikal na sagot. Sa software engineering, ang mga primitive ay tumutukoy sa mga pangunahing yunit ng impormasyon o mga aksyon na ginagawa ng isang ahente. Para sa engineer, mukhang API call o logic gate ito. Sa gumagamit, dapat itong lumitaw bilang isang malinaw na paliwanag. Ang hamon sa disenyo ay nakasalalay sa pagmamapa ng mga teknikal na hakbang na ito sa mga katwiran na nababasa ng tao. Kung nagrerekomenda ang isang ahente ng isang partikular na flight, kailangang malaman ng user kung bakit. Ang interface ay hindi maaaring magtago sa likod ng isang generic na mungkahi. Dapat nitong ilantad ang pinagbabatayan na primitive: Logic: Cheapest_Direct_Flight o Logic: Partner_Airline_Priority. Inilalarawan ng Figure 4 ang daloy ng pagsasaling ito. Kinukuha namin ang raw system na primitive — ang aktwal na lohika ng code — at imapa ito sa isang string na nakaharap sa user. Halimbawa, ang isang primitive na pagsuri sa iskedyul ng kalendaryo ng isang pulong ay nagiging isang malinaw na pahayag: Nagmungkahi ako ng 4 PMpagpupulong. Tinitiyak ng antas ng transparency na ito na lohikal at kapaki-pakinabang ang mga aksyon ng ahente. Nagbibigay-daan ito sa user na i-verify na kumilos ang ahente para sa kanilang pinakamahusay na interes. Sa pamamagitan ng paglalantad ng mga primitive, ginagawa naming glass box ang isang itim na kahon, tinitiyak na ang mga user ay mananatiling panghuling awtoridad sa kanilang sariling mga digital na buhay.

Pagtatakda ng Stage Para sa Disenyo Ang pagbuo ng isang sistemang ahente ay nangangailangan ng bagong antas ng pag-unawa sa sikolohikal at asal. Pinipilit tayo nitong lumampas sa karaniwang pagsubok sa kakayahang magamit at sa larangan ng pagtitiwala, pagpayag, at pananagutan. Ang mga pamamaraan ng pananaliksik na aming tinalakay, mula sa pagsisiyasat sa mga modelo ng pag-iisip hanggang sa pagtulad sa maling pag-uugali at pagtatatag ng mga bagong sukatan, ay nagbibigay ng kinakailangang pundasyon. Ang mga kasanayang ito ay ang mga mahahalagang tool para sa aktibong pagtukoy kung saan maaaring mabigo ang isang autonomous system at, higit sa lahat, kung paano ayusin ang relasyon ng user-agent kapag nangyari ito. Ang paglipat sa ahenteng AI ay isang muling pagpapakahulugan ng relasyon ng user-system. Hindi na kami nagdidisenyo para sa mga tool na tumutugon lamang sa mga utos; kami ay nagdidisenyo para sa mga kasosyo na kumikilos sa ngalan namin. Binabago nito ang kinakailangang disenyo mula sa kahusayan at kadalian ng paggamit hanggang sa transparency, predictability, at kontrol. Kapag ang isang AI ay maaaring mag-book ng flight o mag-trade ng stock nang walang panghuling pag-click, ang disenyo ng "on-ramp" at "off-ramp" nito ay magiging pinakamahalaga. Responsibilidad naming tiyakin na nararamdaman ng mga user na sila ay nasa driver's seat, kahit na naibigay na nila ang manibela. Itinataas din ng bagong realidad na ito ang papel ng UX researcher. Nagiging tagapag-ingat tayo ng tiwala ng user, nakikipagtulungan sa mga inhinyero at tagapamahala ng produkto upang tukuyin at subukan ang mga guardrail ng awtonomiya ng isang ahente. Higit pa sa pagiging mga mananaliksik, nagiging mga tagapagtaguyod kami para sa kontrol ng user, transparency, at mga etikal na pananggalang sa loob ng proseso ng pagbuo. Sa pamamagitan ng pagsasalin ng mga primitive sa mga praktikal na tanong at pagtulad sa mga pinakamasamang sitwasyon, maaari tayong bumuo ng mga mahusay na system na parehong makapangyarihan at ligtas. Binalangkas ng artikulong ito ang "ano" at "bakit" ng pagsasaliksik ng ahenteng AI. Ipinakita nito na hindi sapat ang ating mga tradisyunal na toolkit at dapat tayong magpatibay ng mga bagong pamamaraan. Ang susunod na artikulo ay bubuo sa pundasyong ito, na nagbibigay ng mga partikular na pattern ng disenyo at mga kasanayan sa organisasyon na ginagawang transparent ang utility ng isang ahente sa mga user, na tinitiyak na magagamit nila ang kapangyarihan ng ahenteng AI nang may kumpiyansa at kontrol. Ang hinaharap ng UX ay tungkol sa paggawa ng mga system na mapagkakatiwalaan. Para sa karagdagang pag-unawa sa ahenteng AI, maaari mong tuklasin ang mga sumusunod na mapagkukunan:

Google AI Blog sa Agentic AI Pananaliksik ng Microsoft sa AI Agents

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free