Az Agentic AI készen áll az ügyfélélmény és a működési hatékonyság átalakítására, ami új stratégiai megközelítést tesz szükségessé a vezetés részéről. A mesterséges intelligencia ezen evolúciója felhatalmazza a rendszereket a feladatok tervezésére, végrehajtására és kitartására, az egyszerű ajánlásokon túl a proaktív cselekvésig. Az UX-csapatok, a termékmenedzserek és a vezetők számára ennek a változásnak a megértése alapvető fontosságú az innovációban rejlő lehetőségek felszabadításához, a munkafolyamatok egyszerűsítéséhez és annak újradefiniálásához, hogy a technológia hogyan szolgálja az embereket. Könnyű összetéveszteni az Agentic AI-t a Robotic Process Automation (RPA) technológiával, amely olyan technológia, amely a számítógépeken végrehajtott szabályokon alapuló feladatokra összpontosít. A különbség a merevségben és az érvelésben rejlik. Az RPA kiválóan tud szigorú forgatókönyvet követni: ha X történik, csináld Y. Emberi kezet utánoz. Az Agent AI az emberi érvelést utánozza. Nem követ lineáris szkriptet; létrehoz egyet. Fontolja meg a toborzási munkafolyamatot. Az RPA bot képes beolvasni az önéletrajzot és feltölteni egy adatbázisba. Tökéletesen végrehajtja az ismétlődő feladatokat. Egy ügynöki rendszer megnézi az önéletrajzot, észreveszi, hogy a jelölt felsorol egy adott tanúsítványt, kereszthivatkozásokat tesz erre egy új ügyfélkövetelményre, és úgy dönt, hogy elkészít egy személyre szabott tájékoztatási e-mailt, amelyben kiemeli az egyezést. Az RPA előre meghatározott tervet hajt végre; Az Agent AI egy cél alapján fogalmazza meg a tervet. Ez az autonómia elválasztja az ügynököket az elmúlt évtizedben használt prediktív eszközöktől. Egy másik példa a találkozási konfliktusok kezelése. A naptárába integrált prediktív modell elemezheti az értekezlet ütemezését és kollégái ütemtervét. Ezután potenciális konfliktusokat javasolhat, például két fontos találkozót, amelyet egy időben ütemeztek, vagy egy olyan találkozót, amelyet akkor ütemeztek, amikor egy kulcsfontosságú résztvevő szabadságon van. Tájékoztatást nyújt Önnek, és megjelöli a lehetséges problémákat, de Ön felelős a cselekvésért. Egy ügynök AI ugyanebben a forgatókönyvben túlmutatna azon, hogy elkerülendő konfliktusokat javasoljon. Egy kulcsfontosságú résztvevővel való konfliktus azonosításakor az ügynök a következőképpen járhat el:
Minden szükséges résztvevő elérhetőségének ellenőrzése. Alternatív idősávok azonosítása, amelyek mindenki számára megfelelőek. Javasolt új ülésmeghívók küldése minden résztvevőnek. Ha az ütközés egy külső résztvevővel áll fenn, az ügynök vázlatot készíthet és küldhet egy e-mailt, amelyben elmagyarázza az átütemezés szükségességét, és alternatív időpontokat ajánl fel. A naptár és a kollégák naptárának frissítése az új értekezlet részleteivel a megerősítést követően.
Ez az ügynök AI megérti a célt (az értekezlet-ütközés feloldása), megtervezi a lépéseket (elérhetőség ellenőrzése, alternatívák keresése, meghívók küldése), végrehajtja ezeket a lépéseket, és mindaddig kitart, amíg az ütközés meg nem oldódik, mindezt minimális közvetlen felhasználói beavatkozással. Ez jól mutatja az „ügynöki” különbséget: a rendszer proaktív lépéseket tesz a felhasználó érdekében, ahelyett, hogy csak információt adna a felhasználónak. Az ügynöki mesterséges intelligencia rendszerek megértik a célt, megterveznek egy sor lépést annak eléréséhez, végrehajtják ezeket a lépéseket, és még alkalmazkodnak is, ha a dolgok rosszul mennek. Gondoljon rá úgy, mint egy proaktív digitális asszisztensre. Az alapul szolgáló technológia gyakran kombinálja a nagy nyelvi modelleket (LLM) a megértés és az érvelés érdekében olyan tervezési algoritmusokkal, amelyek az összetett feladatokat kezelhető műveletekre bontják. Ezek az ágensek különféle eszközökkel, API-kkal és akár más AI-modellekkel is kölcsönhatásba léphetnek céljaik elérése érdekében, és kritikusan fontos, hogy fenntartsák a tartós állapotot, ami azt jelenti, hogy emlékeznek a korábbi műveletekre, és idővel folytatják a munkát a cél érdekében. Ez alapvetően különbözik a tipikus generatív AI-tól, amely általában egyetlen kérést teljesít, majd újraindul. Az ügynöki viselkedések egyszerű taxonómiája Az ágensek viselkedését az autonómia négy különböző módozatába sorolhatjuk. Noha ezek gyakran úgy néznek ki, mint egy előrehaladás, önálló működési módként működnek. A felhasználó megbízhat egy ügynökben, hogy önállóan járjon el az ütemezés során, de a pénzügyi tranzakciókhoz „javaslat módban” tartja. Ezeket a szinteket úgy határoztuk meg, hogy az autonóm járművekre vonatkozó iparági szabványokat (SAE-szintek) a digitális felhasználói élményhez igazítottuk. Figyeld meg és javasolj Az ügynök monitorként működik. Elemezi az adatfolyamokat és megjelöli az anomáliákat vagy lehetőségeket, de semmiféle műveletet nem végez. Differenciálás A következő szinttel ellentétben az ügynök nem hoz létre összetett tervet. Problémára mutat. PéldaA DevOps-ügynök észleli a szerver CPU-csúcsát, és riasztja az ügyeletes mérnököt. Nem tudja, hogyan vagy próbálja kijavítani, de tudja, hogy valami nincs rendben. A tervezésre és a felügyeletre gyakorolt hatások Ezen a szintenA tervezésnek és a felügyeletnek előnyben kell részesítenie az egyértelmű, nem tolakodó értesítéseket és egy jól meghatározott folyamatot a felhasználók számára a javaslatok alapján történő cselekvésre. A hangsúly azon van, hogy a felhasználó időszerű és releváns információkhoz jusson anélkül, hogy átvenné az irányítást. A felhasználói élményt gyakorlóknak arra kell összpontosítaniuk, hogy a javaslatokat világosak és könnyen érthetőek legyenek, míg a termékmenedzsereknek biztosítaniuk kell, hogy a rendszer értéket biztosítson anélkül, hogy túlterhelné a felhasználót. Tervezz és javasolj Az ügynök azonosít egy célt, és többlépcsős stratégiát készít annak eléréséhez. Bemutatja az emberi felülvizsgálat teljes tervét. DifferenciálásAz ügynök stratégaként működik. Nem hajtja végre; az egész megközelítés jóváhagyására vár. Példa Ugyanaz a DevOps-ügynök észleli a CPU-csúcsot, elemzi a naplókat, és javítási tervet javasol:
Pörgessen fel két extra példányt. Indítsa újra a terheléselosztót. Archíválja a régi naplókat.
Az ember áttekinti a logikát, és rákattint a „Terv jóváhagyása” gombra. A tervezésre és a felügyeletre gyakorolt hatások A tervező és javaslattevő ügynökök számára a tervezésnek biztosítania kell, hogy a javasolt tervek könnyen érthetőek legyenek, és hogy a felhasználók intuitív módon módosítsák vagy elutasítsák azokat. A felügyelet kulcsfontosságú az ajánlatok minőségének és az ügynök tervezési logikájának nyomon követésében. A felhasználói élményt gyakorló szakembereknek világos vizualizációkat kell tervezniük a javasolt tervekről, a termékmenedzsereknek pedig egyértelmű felülvizsgálati és jóváhagyási munkafolyamatokat kell kialakítaniuk. Cselekvés megerősítéssel Az ügynök elvégzi az összes előkészítő munkát, és a végső akciót színpadra állítja. Hatékonyan nyitva tartja az ajtót, bólintásra vár. DifferenciálásEz különbözik a „Tervezz és javasolj”-tól, mivel a munka már elkészült és színpadra állított. Csökkenti a súrlódást. A felhasználó az eredményt erősíti meg, nem a stratégiát. Példa Egy toborzó ügynök öt interjúmeghívót készít, megkeresi a naptárak nyitvatartási idejét, és létrehozza a naptári eseményeket. Megjelenik az „Összes küldése” gomb. A felhasználó megadja a végső felhatalmazást a külső művelet elindításához. A tervezésre és a felügyeletre gyakorolt hatások Amikor az ügynökök megerősítéssel cselekszenek, a tervnek átlátható és tömör összefoglalót kell adnia a tervezett tevékenységről, egyértelműen felvázolva a lehetséges következményeket. A felügyeletnek ellenőriznie kell, hogy a megerősítési folyamat robusztus-e, és hogy a felhasználókat nem kérik-e a műveletek vak jóváhagyására. A felhasználói élményt gyakorló szakembereknek olyan megerősítő üzeneteket kell kialakítaniuk, amelyek világosak és minden szükséges információt tartalmaznak, a termékmenedzsereknek pedig minden megerősített művelethez egy robusztus ellenőrzési nyomvonalat kell előnyben részesíteniük. Cselekedjen-Autonóm módon Az ügynök meghatározott határokon belül önállóan hajtja végre a feladatokat. MegkülönböztetésA felhasználó a műveletek előzményeit tekinti át, nem magukat a műveleteket. Példa A toborzó ügynök ütközést lát, az interjút egy tartalék helyre helyezi, frissíti a jelöltet, és értesíti a munkaerő-felvételi vezetőt. Az ember csak értesítést lát: Az interjút keddre ütemezték át. Tervezési és felügyeleti vonatkozások Az autonóm ügynökök esetében a tervezésnek egyértelmű, előre jóváhagyott határokat kell megállapítania, és robusztus megfigyelőeszközöket kell biztosítania. A felügyelet megköveteli az ügynök teljesítményének folyamatos értékelését ezeken a határokon belül, a robusztus naplózás, az egyértelmű felülírási mechanizmusok és a felhasználó által definiált tiltó kapcsolók kritikus igénye a felhasználói ellenőrzés és bizalom fenntartása érdekében. A felhasználói élményt gyakorló szakembereknek a hatékony irányítópultok tervezésére kell összpontosítaniuk az autonóm ügynöki viselkedés nyomon követésére, a termékmenedzsereknek pedig gondoskodniuk kell arról, hogy egyértelmű irányítás és etikai irányelvek érvényesüljenek.
Nézzünk meg egy valós alkalmazást a HR-technológiában, hogy lássuk, hogyan működnek ezek a módok. Fontolja meg az „Interjúkoordinációs Ügynököt”, amelyet a munkaerő-felvétel logisztikájának kezelésére terveztek.
Javaslat módbanAz ügynök észreveszi, hogy egy kérdezőt kétszer lefoglaltak. Kiemeli a konfliktust a toborzó irányítópultján: „Figyelem: Sarah-t duplán lefoglalták a 14:00 interjúra.” Terv módban Az ügynök elemzi Sarah naptárát és a jelölt elérhetőségét. Megoldást mutat be: „Javaslom, hogy az interjút helyezzék át csütörtök délelőtt 10 órára. Ehhez Sarah 1:1-re való áthelyezése szükséges a menedzserével.” A toborzó felülvizsgálja ezt a logikát. Megerősítő módbanAz ügynök megszerkeszti az e-maileket a jelöltnek és a vezetőnek. Ez tölti fel a naptári meghívókat. A toborzó egy összefoglalót lát: „Készen áll az átütemezésre csütörtökre. Frissítéseket küld?” A toborzó a „Megerősítés” gombra kattint. Autonóm módbanAz ügynök azonnal kezeli a konfliktust. Tiszteletben tartja az előre meghatározott szabályt: „Mindig előnyben részesítse a jelölt interjúkat a belső 1:1-esekkel szemben.” Mozgatja az értekezletet és elküldi az értesítéseket. A toborzó egy naplóbejegyzést lát: „Megoldvaütemezési ütközés a B jelölt számára.”
Kutatási alapozó: Mit kell kutatni és hogyan A hatékony ágens mesterséges intelligencia fejlesztése külön kutatási megközelítést igényel a hagyományos szoftverekhez vagy akár a generatív MI-hez képest. Az AI-ügynökök autonóm természete, döntési képességük és proaktív cselekvési lehetőségeik speciális módszereket tesznek szükségessé a felhasználói elvárások megértéséhez, az összetett ügynöki viselkedések feltérképezéséhez és a lehetséges kudarcok előrejelzéséhez. A következő kutatási primer felvázolja a kulcsfontosságú módszereket az ágens mesterséges intelligencia ezen egyedi szempontjainak mérésére és értékelésére. Mentális-modellinterjúk Ezek az interjúk feltárják a felhasználók előzetes elképzeléseit arról, hogyan kell viselkednie egy AI-ügynöknek. Ahelyett, hogy egyszerűen megkérdeznénk, mit akarnak a felhasználók, a hangsúly az ügynök képességeinek és korlátainak belső modelljeinek megértésén van. Kerüljük az „ügynök” szó használatát a résztvevőkkel. Sci-fi poggyászt szállít, vagy túl könnyen összetéveszthető egy támogatást vagy szolgáltatásokat kínáló emberi ügynökkel. Ehelyett az „asszisztensek” vagy a „rendszer” köré szervezze a vitát. Fel kell derítenünk, hogy a felhasználók hol húzzák meg a határvonalat a hasznos automatizálás és a tolakodó vezérlés között.
Módszer: Kérje meg a felhasználókat, hogy írják le, rajzolják meg vagy mondják el az ügynökkel való várható interakcióikat különböző hipotetikus forgatókönyvekben. Kulcsfontosságú szondák (különböző iparágakat tükrözve): A kívánt automatizálás határainak és a túlzott automatizálással kapcsolatos lehetséges szorongások megértéséhez kérdezze meg: Ha törlik a járatát, mit szeretne a rendszertől automatikusan? Mi aggasztana, ha ezt az Ön kifejezett utasítása nélkül tenné?
Ha meg szeretné vizsgálni, hogy a felhasználó hogyan érti az ügynök belső folyamatait és a szükséges kommunikációt, kérdezze meg: Képzelje el, hogy egy digitális asszisztens kezeli okosotthonát. Ha egy csomagot kézbesítenek, milyen lépéseket képzel el, és milyen információkat várna?
A többlépcsős folyamaton belüli ellenőrzéssel és beleegyezéssel kapcsolatos elvárások feltárásához kérdezze meg: Ha megkéri digitális asszisztensét, hogy ütemezzen be egy találkozót, milyen lépéseket képzel el? Milyen pontokon szeretne tanácsot kérni, vagy választási lehetőséget adni?
A módszer előnyei: Feltárja az implicit feltételezéseket, kiemeli azokat a területeket, ahol az ügynök tervezett viselkedése eltérhet a felhasználói elvárásoktól, és tájékoztatja a megfelelő kontrollok és visszacsatolási mechanizmusok tervezését.
Ügynöki utazás feltérképezése: A hagyományos felhasználói útleképezéshez hasonlóan az ügynöki útleképezés kifejezetten magának az AI-ügynöknek a várható műveleteire és döntési pontjaira összpontosít, a felhasználó interakciója mellett. Ez segít proaktívan azonosítani a lehetséges buktatókat.
Módszer: Készítsen vizuális térképet, amely felvázolja az ügynök működésének különböző szakaszait a kezdeményezéstől a befejezésig, beleértve az összes lehetséges műveletet, döntést és a külső rendszerekkel vagy felhasználókkal való interakciókat. A térkép legfontosabb elemei: Ügynöki műveletek: Milyen konkrét feladatokat vagy döntéseket hajt végre az ügynök? Információs bemenetek/kimenetek: Milyen adatokra van szüksége az ügynöknek, és milyen információkat generál vagy kommunikál? Döntési szempontok: Hol dönt az ügynök, és mik a kritériumok ezekhez a döntésekhez? Felhasználói interakciós pontok: Hol adhat meg bevitelt, tekinthet át vagy hagyhat jóvá a felhasználó a műveleteket? Hibapontok: Lényeges, hogy azonosítsa azokat az eseteket, amikor az ügynök félreértelmezheti az utasításokat, helytelen döntést hozhat, vagy nem a megfelelő entitással lép kapcsolatba. Példák: helytelen címzett (pl. érzékeny információ rossz személynek küldése), folyószámlahitel (pl. a rendelkezésre álló keretet meghaladó automatizált fizetés), a szándék félreértelmezése (pl. félreérthető nyelvezet miatt rossz dátumra foglalt repülőjegyet).
Helyreállítási útvonalak: Hogyan tud az ügynök vagy a felhasználó felépülni ezekből a hibákból? Milyen korrekciós vagy beavatkozási mechanizmusok léteznek?
A módszer előnyei: Holisztikus képet ad az ügynök működési folyamatáról, feltárja a rejtett függőségeket, és lehetővé teszi a biztosítékok, a hibakezelés és a felhasználói beavatkozási pontok proaktív tervezését a negatív következmények megelőzésére vagy enyhítésére.
Szimulált helytelen viselkedésteszt: Ez a megközelítés a rendszer stressztesztjére és a felhasználói reakciók megfigyelésére szolgál, amikor az AI-ügynök meghibásodik vagy eltér az elvárásoktól. Arról szól, hogy megértsük a bizalom helyreállítását és az érzelmi reakciókat kedvezőtlen helyzetekben.
Módszer: Az ellenőrzött laboratóriumi vizsgálatokban szándékosan vezessen be olyan forgatókönyveket, amikor az ügynök hibát követ el, félreértelmez egy parancsot vagy váratlanul viselkedik. A szimulálandó „helytelen viselkedés” típusai: ParancsFélreértelmezés: Az ügynök a felhasználó szándékától kissé eltérő műveletet hajt végre (pl. két tételt rendel egy helyett). Információ túlterhelés/alulterhelés: Az ügynök túl sok irreleváns információt vagy nem elég kritikus részletet ad. Kéretlen művelet: Az ügynök olyan műveletet hajt végre, amelyet a felhasználó kifejezetten nem akart vagy nem várt (pl. jóváhagyás nélkül vásárol részvényt). Rendszerhiba: Az ügynök összeomlik, nem válaszol, vagy hibaüzenetet ad. Etikai dilemmák: Az ügynök olyan döntést hoz, amelynek etikai vonatkozásai vannak (pl. egy előre nem látható mérőszám alapján az egyik feladatot a másikkal szemben előnyben részesíti).
Megfigyelés fókusza: Felhasználói reakciók: Hogyan reagálnak a felhasználók érzelmileg (frusztráció, harag, zavartság, bizalomvesztés)? Helyreállítási kísérletek: Milyen lépéseket tesznek a felhasználók az ügynök viselkedésének kijavításához vagy műveleteinek visszavonásához? Bizalomjavító mechanizmusok: A rendszer beépített helyreállítási vagy visszacsatolási mechanizmusai segítenek a bizalom helyreállításában? Hogyan szeretnének a felhasználók értesülni a hibákról? Mentális modellváltás: Megváltoztatja-e a helytelen viselkedés a felhasználót az ügynök képességeiről vagy korlátairól?
A módszer előnyei: Kulcsfontosságú a hibajavítással, a visszajelzéssel és a felhasználói vezérléssel kapcsolatos tervezési hiányosságok azonosításában. Betekintést nyújt abba, hogy a felhasználók mennyire ellenállóak az ügynökhibákkal szemben, és mi szükséges a bizalom fenntartásához vagy újjáépítéséhez, ami robusztusabb és megbocsátóbb ügynökrendszerekhez vezet.
E kutatási módszertanok integrálásával a felhasználói élményt gyakorló szakemberek az ügynöki rendszerek egyszerű használhatóvá tételén túlmenően megbízhatóvá, ellenőrizhetővé és elszámoltathatóvá tehetik őket, elősegítve a felhasználók és mesterséges intelligencia-ügynökeik közötti pozitív és produktív kapcsolatot. Vegye figyelembe, hogy nem ezek az egyetlen módszerek, amelyek relevánsak az ügynöki mesterséges intelligencia hatékony feltárásához. Sok más módszer is létezik, de ezek a legkönnyebben elérhetők a szakemberek számára a közeljövőben. Korábban már foglalkoztam a Wizard of Oz módszerrel, egy kicsit fejlettebb koncepciótesztelési módszerrel, amely szintén értékes eszköz az ügynöki AI-koncepciók feltárásához. Etikai szempontok a kutatás módszertanában Az ügynöki mesterséges intelligencia kutatása során, különösen a helytelen viselkedés vagy hibák szimulálásakor, az etikai megfontolásokat kulcsfontosságú figyelembe venni. Számos publikáció foglalkozik az etikus UX-kutatással, beleértve a Smashing Magazine számára írt cikket, az UX Design Institute irányelveit és az Inclusive Design Toolkit oldalát. Az ügynöki mesterséges intelligencia kulcsfontosságú mutatói Az ügynöki mesterséges intelligencia rendszerek teljesítményének és megbízhatóságának hatékony felméréséhez kulcsfontosságú mutatók átfogó készletére lesz szüksége. Ezek a mutatók betekintést nyújtanak a felhasználói bizalomba, a rendszer pontosságába és az általános felhasználói élménybe. Ezen mutatók követésével a fejlesztők és a tervezők azonosíthatják a fejlesztésre szoruló területeket, és biztosíthatják, hogy az AI-ügynökök biztonságosan és hatékonyan működjenek. 1. Beavatkozási arány Az autonóm ágensek sikerét a csendben mérjük. Ha egy ügynök végrehajt egy feladatot, és a felhasználó nem avatkozik be vagy nem fordítja vissza a műveletet egy beállított időtartamon belül (például 24 órán belül), akkor azt elfogadásnak számítjuk. Nyomon követjük a beavatkozási arányt: milyen gyakran ugrik be egy ember, hogy megállítsa vagy kijavítsa az ügynököt? A magas beavatkozási arány a bizalom vagy a logika hibáját jelzi. 2. Nem szándékolt műveletek gyakorisága 1000 feladatonként Ez a kritikus mérőszám számszerűsíti az AI-ügynök által a felhasználó által nem kívánt vagy nem várt műveletek számát 1000 elvégzett feladatra normalizálva. A nem szándékos műveletek alacsony gyakorisága egy jól összehangolt mesterséges intelligencia jele, amely pontosan értelmezi a felhasználói szándékot, és meghatározott határokon belül működik. Ez a mérőszám szorosan kapcsolódik az AI-nak a kontextus megértéséhez, a parancsok egyértelmű megkülönböztetésére való képességéhez és a biztonsági protokollok robusztusságához. 3. Visszaállítási vagy visszavonási arányok Ez a mérőszám azt követi, hogy a felhasználóknak milyen gyakran kell visszafordítaniuk vagy visszavonniuk az AI által végrehajtott műveletet. A magas visszaállítási arány arra utal, hogy a mesterséges intelligencia gyakori hibákat követ el, félreértelmezi az utasításokat, vagy olyan módon cselekszik, amely nincs összhangban a felhasználói elvárásokkal. A visszaállítások mögött meghúzódó okok elemzése értékes visszajelzést adhat az AI algoritmusainak javításához, a felhasználói preferenciák megértéséhez és a kívánatos eredmények előrejelzésének képességéhez. Ahhoz, hogy megértse, miért, végre kell hajtania egy mikrofelmérést a visszavonási műveletről. Például amikor a felhasználó visszavonja az ütemezés módosítását, egy egyszerű felszólítás megkérdezheti: "Rossz idő? Rossz személy? Vagy csak te akartad megtenni?" Lehetővé teszi a felhasználó számára, hogy rákattintson az érvelésének leginkább megfelelő lehetőségre. 4. A megoldásig eltelt idő hiba utánEz a mérőszámazt az időtartamot méri, amely alatt a felhasználó kijavítja az AI által elkövetett hibát, vagy maga az AI-rendszer helyreáll a hibás állapotból. A megoldásig eltelt rövid idő hatékony és felhasználóbarát hiba-helyreállítási folyamatot jelez, amely csökkentheti a felhasználók frusztrációját és fenntarthatja a termelékenységet. Ez magában foglalja a hiba egyszerű azonosítását, a visszavonási vagy korrekciós mechanizmusok hozzáférhetőségét, valamint az AI által biztosított hibaüzenetek egyértelműségét.
Ezeknek a mutatóknak az összegyűjtése megköveteli a rendszer műszerezését az ügynökművelet-azonosítók nyomon követéséhez. Az ügynök által végrehajtott minden egyedi műveletnek, például menetrendjavaslatnak vagy járatfoglalásnak egyedi azonosítót kell generálnia, amely a naplókban is megmarad. Az Intervention Rate méréséhez nem keresünk azonnali felhasználói reakciót. Egy meghatározott ablakon belül keressük az ellenművelet hiányát. Ha egy műveletazonosítót 9:00-kor generálnak, és másnap reggel 9:00-ig egyetlen emberi felhasználó sem módosítja vagy állítja vissza az adott azonosítót, a rendszer logikusan Elfogadva címkével látja el. Ez lehetővé teszi számunkra, hogy számszerűsítsük a sikert a felhasználó elhallgatása, semmint az aktív megerősítés alapján. A visszaállítási arányok esetében a nyers számok nem elegendőek, mert hiányzik a kontextus. A mögöttes ok rögzítéséhez alkalmaznia kell az elfogási logikát az alkalmazás Visszavonás vagy Visszaállítás funkcióiban. Ha a felhasználó visszafordít egy ügynök által kezdeményezett műveletet, indítson el egy könnyű mikrofelmérést. Ez lehet egy egyszerű, három lehetőségből álló mód, amely arra kéri a felhasználót, hogy a hibát tényszerűen hibásnak minősítse, nem tartalmaz kontextust, vagy egyszerűen preferálja a feladat manuális kezelését. Ez egyesíti a kvantitatív telemetriát a minőségi betekintéssel. Lehetővé teszi a mérnöki csapatok számára, hogy különbséget tudjanak tenni a hibás algoritmus és a felhasználói preferenciák eltérése között. Ezek a mutatók következetesen nyomon követve és holisztikusan elemezve szilárd keretet biztosítanak az ügynöki mesterséges intelligencia rendszerek teljesítményének értékeléséhez, lehetővé téve az ellenőrzés, a beleegyezés és az elszámoltathatóság folyamatos fejlesztését. Tervezés a megtévesztés ellen Ahogy az ágensek egyre alkalmasabbakká válnak, új kockázattal kell szembenéznünk: az Agentic Sludge-val. A hagyományos iszap súrlódásokat okoz, ami megnehezíti az előfizetés lemondását vagy a fiók törlését. Az ágens iszap fordítottan hat. Megszünteti a súrlódást a hibához, így a felhasználó túlságosan könnyen beleegyezik egy olyan tevékenységbe, amely a vállalkozás javát szolgálja, nem pedig a saját érdekeit. Vegye fontolóra egy ügynököt, aki segít az utazások lefoglalásában. Tiszta védőkorlátok nélkül a rendszer előnyben részesítheti a partner légitársaságot vagy egy magasabb árrésű szállodát. Ezt a választást mutatja be optimális útnak. A felhasználó a rendszer jogosultságában bízva, vizsgálat nélkül elfogadja az ajánlást. Ez megtévesztő mintát hoz létre, ahol a rendszer a kényelem leple alatt bevételre optimalizál. A hamisan elképzelt kompetencia kockázata A megtévesztés nem származhat rosszindulatú szándékból. Az AI-ban gyakran képzeletbeli kompetenciaként jelenik meg. A nagy nyelvű modellek gyakran akkor is hitelesnek tűnnek, ha hibásak. Hamis foglalási visszaigazolást vagy pontatlan összegzést ugyanolyan magabiztossággal mutatnak be, mint igazolt tényt. A felhasználók természetesen megbízhatnak ebben a magabiztos hangnemben. Ez az eltérés veszélyes szakadékot hoz létre a rendszer képességei és a felhasználói elvárások között. Kifejezetten úgy kell terveznünk, hogy áthidaljuk ezt a szakadékot. Ha egy ügynök nem hajt végre egy feladatot, az interfésznek egyértelműen jeleznie kell a hibát. Ha a rendszer bizonytalan, a bizonytalanságot kell kifejeznie, nem pedig csiszolt prózával álcáznia. Átláthatóság a primitíveken keresztül Mind az iszap, mind a hallucináció ellenszere a származás. Minden autonóm művelethez szükség van egy speciális metaadat-címkére, amely elmagyarázza a döntés eredetét. A felhasználóknak meg kell tudniuk vizsgálni az eredmény mögött meghúzódó logikai láncot. Ennek eléréséhez a primitíveket gyakorlati válaszokká kell lefordítanunk. A szoftverfejlesztésben a primitívek az ügynök által végrehajtott információ vagy műveletek alapvető egységeire utalnak. A mérnök számára ez API-hívásnak vagy logikai kapunak tűnik. A felhasználó számára egyértelmű magyarázatként kell megjelennie. A tervezési kihívás abban rejlik, hogy ezeket a technikai lépéseket leképezzük az ember által olvasható indokokra. Ha egy ügynök egy adott járatot ajánl, a felhasználónak tudnia kell, miért. A felület nem bújhat el egy általános javaslat mögé. Fel kell fednie a mögöttes primitívet: Logic: Cheapest_Direct_Flight vagy Logic: Partner_Airline_Priority. A 4. ábra ezt a fordítási folyamatot szemlélteti. Vegyük a nyers rendszerprimitívet – a tényleges kódlogikát –, és leképezzük egy felhasználó felé forduló karakterláncra. Például egy találkozó naptári ütemezésének primitív ellenőrzése egyértelmű kijelentéssé válik: 16:00-at javasoltam.találkozó. Az átláthatóság ilyen szintje biztosítja, hogy az ügynök tevékenységei logikusnak és hasznosnak tűnjenek. Lehetővé teszi a felhasználó számára annak ellenőrzését, hogy az ügynök az ő érdekükben járt-e el. A primitívek leleplezésével a fekete dobozt üvegdobozzá alakítjuk, így biztosítva, hogy a felhasználók továbbra is a saját digitális életük végső tekintélyei maradjanak.
A tervezés színterének beállítása Az ügynökrendszer felépítése a pszichológiai és viselkedési megértés új szintjét kívánja meg. Arra kényszerít bennünket, hogy túllépjünk a hagyományos használhatósági tesztelésen, és a bizalom, a beleegyezés és az elszámoltathatóság birodalmába lépjünk. Az általunk tárgyalt kutatási módszerek a mentális modellek vizsgálatától a helytelen viselkedés szimulálásáig és új mérőszámok megállapításáig megfelelő alapot biztosítanak. Ezek a gyakorlatok az alapvető eszközök annak proaktív azonosításához, hogy hol hibásodhat meg egy autonóm rendszer, és ami még fontosabb, hogyan javítható a felhasználói ügynök kapcsolat, ha ez megtörténik. Az ügynöki mesterséges intelligencia felé való elmozdulás a felhasználó-rendszer kapcsolat újradefiniálása. Már nem olyan eszközöket tervezünk, amelyek egyszerűen reagálnak a parancsokra; a nevünkben eljáró partnerek számára tervezünk. Ez megváltoztatja a tervezési követelményt a hatékonyságról és a könnyű használatról az átláthatóságra, a kiszámíthatóságra és az ellenőrzésre. Amikor egy mesterséges intelligencia egy utolsó kattintás nélkül tud repülőjegyet foglalni vagy részvényekkel kereskedni, a „rámpák” és az „off-ramps” kialakítása a legfontosabb. A mi felelősségünk annak biztosítása, hogy a felhasználók úgy érezzék, a vezetőülésben ülnek, még akkor is, ha átadták a kormányt. Ez az új valóság az UX-kutató szerepét is emeli. A felhasználói bizalom őrzőivé válunk, mérnökökkel és termékmenedzserekkel együttműködve meghatározzuk és teszteljük az ügynökök autonómiájának korlátait. Amellett, hogy kutatók vagyunk, a felhasználói ellenőrzés, az átláthatóság és az etikai biztosítékok szószólóivá válunk a fejlesztési folyamaton belül. A primitívek gyakorlati kérdésekre fordításával és a legrosszabb forgatókönyvek szimulálásával robusztus rendszereket építhetünk, amelyek egyszerre hatékonyak és biztonságosak. Ez a cikk felvázolta a „mit” és „miért” az ügynöki MI kutatását. Megmutatta, hogy a hagyományos eszköztáraink nem elegendőek, és új, előremutató módszereket kell alkalmaznunk. A következő cikk erre az alapra épít, és bemutatja azokat a konkrét tervezési mintákat és szervezési gyakorlatokat, amelyek átláthatóvá teszik az ügynöki segédprogramot a felhasználók számára, biztosítva, hogy magabiztosan és kontroll alatt tudják kihasználni az ügynöki mesterséges intelligencia erejét. Az UX jövője a rendszerek megbízhatóvá tételéről szól. Az ügynöki mesterséges intelligencia további megértéséhez a következő forrásokat fedezheti fel:
Google AI blog az Agent AI-ról A Microsoft AI-ügynökökkel kapcsolatos kutatása