Oblikovanje za avtonomne agente predstavlja edinstveno frustracijo. Kompleksno nalogo predamo AI, ta izgine za 30 sekund (ali 30 minut), nato pa se vrne z rezultatom. Strmiva v ekran. Je uspelo? Ali je haluciniralo? Ali je preveril zbirko podatkov o skladnosti ali preskočil ta korak? Na to tesnobo se običajno odzovemo z eno od dveh skrajnosti. Sistem bodisi ohranjamo kot črno skrinjico, v kateri vse skrivamo, da ohranimo preprostost, ali pa se zgrabimo in zagotovimo izpis podatkov, ki pretaka vsako vrstico dnevnika in klic API-ja do uporabnika. Nobeden od pristopov ne obravnava neposredno odtenkov, ki so potrebni za zagotavljanje idealne ravni preglednosti uporabnikom. Zaradi črne škatle se uporabniki počutijo nemočne. Izmet podatkov povzroči slepoto obveščanja in uniči učinkovitost, ki jo je agent obljubil zagotoviti. Uporabniki ignorirajo stalni tok informacij, dokler se nekaj ne pokvari, na tej točki pa nimajo konteksta, da bi to popravili. Potrebujemo organiziran način, da najdemo ravnotežje. V mojem prejšnjem članku, »Oblikovanje za agentsko umetno inteligenco«, smo si ogledali elemente vmesnika, ki gradijo zaupanje, na primer predhodni prikaz nameravanega dejanja umetne inteligence (predogledi namena) in omogočanje uporabnikom nadzora nad tem, koliko umetna inteligenca naredi sama (številčnice za avtonomijo). Toda vedeti, katere elemente uporabiti, je le del izziva. Težje vprašanje za oblikovalce je vedeti, kdaj jih uporabiti. Kako veste, kateri trenutek v 30-sekundnem delovnem toku zahteva predogled namere in katerega je mogoče obravnavati s preprostim vnosom v dnevnik? Ta članek ponuja metodo za odgovor na to vprašanje. Sprehodili se bomo skozi revizijo vozlišča odločitev. S tem postopkom so oblikovalci in inženirji v isti sobi, da preslikajo zaledno logiko v uporabniški vmesnik. Naučili se boste, kako natančno določiti trenutke, ko uporabnik potrebuje posodobitev o tem, kaj počne AI. Obravnavali bomo tudi matriko vpliva/tveganja, ki bo pomagala določiti prednost, katera vozlišča odločitve je treba prikazati, in morebitne povezane vzorce oblikovanja, ki jih je treba združiti s to odločitvijo. Trenutki preglednosti: primer študije primera Razmislite o Meridianu (ni pravo ime), zavarovalnici, ki uporablja agentsko umetno inteligenco za obdelavo začetnih zahtevkov za nezgode. Uporabnik naloži fotografije poškodb vozila in policijski zapisnik. Agent nato za minuto izgine, preden se vrne z oceno tveganja in predlaganim razponom izplačila. Sprva je Meridianov vmesnik preprosto prikazal Izračun statusa zahtevka. Uporabniki so postali razočarani. Predložili so več podrobnih dokumentov in niso bili prepričani, ali je AI sploh pregledal policijsko poročilo, ki je vsebovalo olajševalne okoliščine. Črna skrinjica je ustvarila nezaupanje. Da bi to odpravili, je oblikovalska skupina izvedla revizijo vozlišča odločanja. Ugotovili so, da je AI izvedel tri različne korake, ki temeljijo na verjetnosti, s številnimi vdelanimi manjšimi koraki:
Analiza slike. Agent je primerjal fotografije škode z bazo podatkov tipičnih scenarijev prometnih nesreč, da bi ocenil stroške popravila. To je vključevalo oceno zaupanja. Pregled besedila. Pregledal je policijsko poročilo za ključne besede, ki vplivajo na odgovornost (npr. napaka, vremenske razmere, treznost). To je vključevalo oceno verjetnosti pravnega statusa. Navzkrižno sklicevanje na politiko Primerjal je podrobnosti zahtevka s posebnimi določili pravilnika uporabnika, pri čemer je iskal izjeme ali omejitve kritja. To je vključevalo tudi verjetnostno ujemanje.
Ekipa je te korake spremenila v trenutke preglednosti. Zaporedje vmesnika je bilo posodobljeno na:
Ocenjevanje fotografij škode: Primerjava s 500 profili udarcev vozil. Pregled policijskega poročila: Analiza ključnih besed odgovornosti in pravnega precedensa. Preverjanje kritja politike: preverjanje posebnih izključitev v vašem načrtu.
Sistem je še vedno vzel enako količino časa, vendar je eksplicitna komunikacija o internem delovanju agenta povrnila zaupanje uporabnika. Uporabniki so razumeli, da umetna inteligenca opravlja zapleteno nalogo, za katero je bila zasnovana, in natančno so vedeli, kam usmeriti svojo pozornost, če se končna ocena zdi netočna. Ta oblikovalska izbira je trenutek tesnobe spremenila v trenutek povezave z uporabnikom. Uporaba matrike vpliva/tveganja: kaj smo se odločili skriti Večini izkušenj z umetno inteligenco ne manjka dogodkov in odločitvenih vozlišč, ki bi se lahko potencialno prikazala med obdelavo. Eden najbolj kritičnih rezultatov revizije je bila odločitev, kaj naj ostane nevidno. V primeru Meridian so zaledni dnevniki ustvarili 50+ dogodkov na zahtevek. Lahko bi privzeto prikazali vsak dogodek, ko je bil obdelan kot del uporabniškega vmesnika. Namesto tega smo za njihovo obrezovanje uporabili matriko tveganja:
Dogodek v dnevniku: Pingiranje strežnikaWest-2 za preverjanje odvečnosti. Razsodba filtra: Skrij. (Nizki vložki, visoka tehničnost).
Dnevnik dogodka: primerjava ocene popravila z vrednostjo BlueBook. Razsodba filtra: Pokaži. (Visoki vložki, vplivajo na izplačilo uporabnika).
Z izrezovanjem nepotrebnih podrobnosti so bile pomembne informacije – kot je preverjanje pokritosti – bolj vplivne. Ustvarili smo odprt vmesnik in oblikovali odprto izkušnjo. Ta pristop uporablja idejo, da se ljudje bolje počutijo glede storitve, ko vidijo, da je delo opravljeno. S prikazom določenih korakov (ocenjevanje, pregledovanje, preverjanje) smo 30-sekundno čakanje spremenili iz časa skrbi (»Ali je pokvarjeno?«) v čas občutka, kot da se ustvarja nekaj dragocenega (»Razmišlja«). Oglejmo si zdaj podrobneje, kako lahko pregledamo postopek odločanja v naših izdelkih, da prepoznamo ključne trenutke, ki zahtevajo jasne informacije. Revizija vozlišča odločitev Preglednost ne uspe, če jo obravnavamo kot izbiro sloga in ne kot funkcionalno zahtevo. Nagnjeni smo k temu, da se vprašamo: "Kako naj bi izgledal uporabniški vmesnik?" preden se vprašamo: "Kaj se agent dejansko odloči?" Revizija vozlišča odločanja je preprost način za lažje razumevanje sistemov umetne inteligence. Deluje tako, da natančno načrtuje notranji proces sistema. Glavni cilj je najti in jasno opredeliti točne trenutke, ko sistem neha slediti zastavljenim pravilom in namesto tega izbira na podlagi naključja ali ocene. S preslikavo te strukture lahko ustvarjalci pokažejo te točke negotovosti neposredno ljudem, ki uporabljajo sistem. To spremeni sistemske posodobitve iz nejasnih izjav v specifična, zanesljiva poročila o tem, kako je umetna inteligenca prišla do zaključka. Poleg zgornje študije zavarovalniškega primera sem pred kratkim sodeloval z ekipo, ki je oblikovala agenta za nabavo. Sistem je pregledal pogodbe prodajalcev in označil tveganja. Prvotno je zaslon prikazal preprosto vrstico napredka: »Pregled pogodb«. Uporabniki so to sovražili. Naša raziskava je pokazala, da so bili zaskrbljeni zaradi pravnih posledic manjkajoče klavzule. To smo popravili z izvedbo revizije vozlišča odločitve. Na koncu tega članka sem vključil kontrolni seznam po korakih za izvedbo te revizije. Izvedli smo sejo z inženirji in orisali, kako sistem deluje. Identificirali smo »točke odločitve« – trenutke, ko je morala AI izbirati med dvema dobrima možnostma. V standardnih računalniških programih je postopek jasen: če se zgodi A, se bo vedno zgodil B. V sistemih AI proces pogosto temelji na naključju. Umetna inteligenca meni, da je A verjetno najboljša izbira, vendar je morda le 65-odstotna gotovost. V pogodbenem sistemu smo našli trenutek, ko je AI preveril pogoje odgovornosti glede na pravila našega podjetja. Redko je bilo popolno ujemanje. Umetna inteligenca se je morala odločiti, ali je 90-odstotno ujemanje dovolj dobro. To je bila ključna točka odločitve.
Ko smo identificirali to vozlišče, smo ga izpostavili uporabniku. Namesto "Pregled pogodb," je vmesnik posodobljen tako, da piše: "Klavzula o odgovornosti se razlikuje od standardne predloge. Analiza stopnje tveganja." Ta posebna posodobitev je uporabnikom vlila zaupanje. Vedeli so, da je agent preveril klavzulo o odgovornosti. Razumeli so razlog za zamudo in pridobili zaupanje, da se želeno dejanje dogaja na zadnji strani. Vedeli so tudi, kam se poglobiti, ko je agent ustvaril pogodbo. Če želite preveriti, kako AI sprejema odločitve, morate tesno sodelovati s svojimi inženirji, produktnimi vodji, poslovnimi analitiki in ključnimi ljudmi, ki sprejemajo odločitve (pogosto skrite), ki vplivajo na delovanje orodja AI. Narišite korake, ki jih opravi orodje. Označite vsako mesto, kjer proces spremeni smer, ker je izpolnjena verjetnost. To so mesta, kjer bi se morali osredotočiti na večjo preglednost. Kot je prikazano na sliki 2 spodaj, revizija vozlišča odločanja vključuje te korake:
Zberite ekipo: vključite lastnike izdelkov, poslovne analitike, oblikovalce, ključne odločevalce in inženirje, ki so zgradili AI. na primer Razmislite o skupini izdelkov, ki gradi orodje AI, namenjeno pregledovanju neurejenih pravnih pogodb. Ekipa vključuje oblikovalca UX, produktnega vodjo, raziskovalca UX, odvetnika, ki deluje kot strokovnjak za zadevo, in zalednega inženirja, ki je napisal kodo za analizo besedila.
Narišite celoten postopek: dokumentirajte vsak korak, ki ga opravi umetna inteligenca, od prvega dejanja uporabnika do končnega rezultata. Ekipa stoji za tablo in skicira celotno zaporedje za ključni potek dela, ki vključuje AI, ki išče klavzulo o odgovornosti v zapleteni pogodbi. Odvetnik nalagapetdesetstranski PDF → Sistem pretvori dokument v berljivo besedilo. → AI skenira strani za klavzule o odgovornosti. → Uporabnik čaka. → Nekaj trenutkov ali minut pozneje orodje osvetli najdene odstavke rumeno na uporabniškem vmesniku. To storijo tudi za številne druge poteke dela, ki jih orodje omogoča.
Poiščite, kje so stvari nejasne: na zemljevidu procesa poiščite katero koli mesto, kjer umetna inteligenca primerja možnosti ali vnose, ki nimajo enega popolnega ujemanja. Ekipa pogleda na tablo, da opazi dvoumne korake. Pretvarjanje slike v besedilo sledi strogim pravilom. Iskanje posebne klavzule o odgovornosti vključuje ugibanje. Vsako podjetje zapiše te klavzule drugače, zato mora umetna inteligenca pretehtati več možnosti in narediti napoved, namesto da bi poiskala natančno besedno ujemanje.
Določite korake »najboljšega ugibanja«: Za vsako nejasno mesto preverite, ali sistem uporablja oceno zaupanja (ali je na primer 85-odstotno prepričan?). To so točke, kjer AI naredi končno izbiro. Sistem mora uganiti (dati verjetnost), kateri(-i) odstavek(-i) je zelo podoben standardni klavzuli o odgovornosti. Svojemu najboljšemu ugibanju dodeli oceno zaupanja. To ugibanje je vozlišče odločitve. Vmesnik mora odvetniku povedati, da poudarja potencialno ujemanje, namesto da navede, da je našel dokončno klavzulo.
Preglejte izbiro: Za vsako točko izbire ugotovite specifično interno matematiko ali primerjavo, ki se izvaja (npr. povezovanje dela pogodbe s polico ali primerjava slike pokvarjenega avtomobila s knjižnico fotografij poškodovanega avtomobila). Inženir pojasnjuje, da sistem primerja različne odstavke z bazo podatkov standardnih klavzul o odgovornosti iz preteklih primerov podjetij. Izračuna rezultat podobnosti besedila, da se odloči za ujemanje na podlagi verjetnosti.
Napišite jasne razlage: ustvarite sporočila za uporabnika, ki jasno opisujejo določeno notranje dejanje, ki se zgodi, ko se AI odloči. Oblikovalec vsebine napiše točno določeno sporočilo za ta trenutek. Besedilo se glasi: Primerjava besedila dokumenta s standardnimi trdnimi klavzulami za prepoznavanje možnih tveganj odgovornosti.
Posodobite zaslon: vnesite te nove, jasne razlage v uporabniški vmesnik in nadomestite nejasna sporočila, kot je »Pregled pogodb«. Oblikovalska skupina odstrani generični obračalnik za nalaganje PDF-jev. Novo razlago vstavijo v statusno vrstico, ki se nahaja tik nad pregledovalnikom dokumentov, medtem ko AI razmišlja.
Preveri zaupanje: Poskrbite, da bodo nova sporočila na zaslonu uporabnikom dala preprost razlog za kakršen koli čas čakanja ali rezultat, zaradi česar se bodo počutili bolj samozavestne in zaupljive.
Matrika vpliva/tveganja Ko natančno pogledate proces umetne inteligence, boste verjetno našli veliko točk, kjer izbira. AI lahko naredi na desetine majhnih odločitev za eno samo zapleteno nalogo. Prikazovanje vseh ustvari preveč nepotrebnih informacij. Te izbire morate združiti. Uporabite lahko matriko vpliva/tveganja, da te izbire razvrstite glede na vrste dejanj, ki jih izvaja umetna inteligenca. Tukaj so primeri matrik učinka/tveganja: Najprej poiščite odločitve z nizkimi vložki in majhnim učinkom. Nizki vložki / majhen vpliv
Primer: Organiziranje datotečne strukture ali preimenovanje dokumenta. Potreba po preglednosti: minimalna. Zadostuje subtilno obvestilo ali vnos v dnevnik. Uporabniki lahko ta dejanja preprosto razveljavijo.
Nato določite odločitve z visokimi vložki in velikimi učinki. Visoki vložki / velik učinek
Primer: zavrnitev vloge za posojilo ali izvedba trgovanja z delnicami. Potreba po preglednosti: visoka. Ta dejanja zahtevajo dokazilo o delu. Sistem mora dokazati utemeljitev pred ali takoj, ko deluje.
Razmislite o botu za finančno trgovanje, ki obravnava vsa nakupna/prodajna naročila enako. Izvaja trgovanje v vrednosti 5 USD z enako motnostjo kot trgovanje v vrednosti 50.000 USD. Uporabniki se lahko sprašujejo, ali orodje prepozna potencialni vpliv preglednosti na trgovanje z velikim zneskom v dolarjih. Potrebujejo, da se sistem začasno ustavi in pokaže svoje delo pri poslih z visokimi vložki. Rešitev je uvedba stanja pregledne logike za vsako transakcijo, ki presega določen znesek v dolarjih, kar uporabniku omogoča, da vidi dejavnike, ki vodijo odločitev pred izvedbo. Preslikava vozlišč v vzorce: Rubrika za izbiro vzorcev oblikovanja Ko identificirate ključna vozlišča odločitve svoje izkušnje, se morate odločiti, kateri vzorec uporabniškega vmesnika velja za vsakega, ki ga boste prikazali. V Designing For Agentic AI smo uvedli vzorce, kot sta Intent Preview (za nadzor z visokimi vložki) in Action Audit (za retrospektivno varnost). Odločilni dejavnik pri izbiri med njimi je reverzibilnost. Filtriramo vsakoodločitveno vozlišče skozi matriko vpliva, da se dodeli pravilen vzorec: Visoki vložki in nepreklicno: ta vozlišča zahtevajo predogled namere. Ker uporabnik ne more preprosto razveljaviti dejanja (npr. trajno brisanje baze podatkov), se mora trenutek preglednosti zgoditi pred izvedbo. Sistem se mora ustaviti, pojasniti svojo namero in zahtevati potrditev. Visoki vložki in reverzibilnost: Ta vozlišča se lahko zanašajo na vzorec revizije in razveljavitve dejanj. Če prodajni agent, ki ga poganja AI, potencialno stranko premakne v drug cevovod, lahko to stori samostojno, če o tem obvesti uporabnika in ponudi takojšen gumb za razveljavitev. S to strogo kategorizacijo vozlišč se izognemo »utrujenosti opozorila«. Predogled namere z visokim trenjem rezerviramo samo za resnično nepopravljive trenutke, medtem ko se zanašamo na revizijo ukrepanja, da ohrani hitrost za vse ostalo.
Reverzibilen Nepovratno Majhen vpliv Tip: Auto-ExecuteUI: Pasivni Toast / LogEx: Preimenovanje datoteke Tip: ConfirmUI: Možnost preproste razveljavitve. Primer: arhiviranje e-pošte Velik vpliv Tip: ReviewUI: obvestilo + pregled TrailEx: pošiljanje osnutka stranki Tip: Predogled namena UI: Modalno / Eksplicitno dovoljenjeEx: Brisanje strežnika
Tabela 1: Matriko vpliva in reverzibilnosti lahko nato uporabite za preslikavo vaših trenutkov preglednosti v vzorce oblikovanja. Kvalitativna validacija: "Čakaj, zakaj?" Test Potencialna vozlišča lahko identificirate na beli tabli, vendar jih morate potrditi s človeškim vedenjem. Preveriti morate, ali se vaš zemljevid ujema z mentalnim modelom uporabnika. Uporabljam protokol, imenovan "Počakaj, zakaj?" Test. Prosite uporabnika, naj opazuje, kako agent dokonča nalogo. Naročite jim, naj govorijo na glas. Kadarkoli postavijo vprašanje: "Čakaj, zakaj je to storil?" ali "Ali se je zataknilo?" ali "Ali me je slišalo?" — označite časovni žig. Ta vprašanja kažejo na zmedenost uporabnikov. Uporabnik čuti, da mu nadzor uhaja. Na primer, v študiji za asistenta za načrtovanje zdravstvenih storitev so uporabniki opazovali, kako agent rezervira termin. Zaslon je bil statičen štiri sekunde. Udeleženci so dosledno spraševali: "Ali preverjam svoj koledar ali zdravnikov?"
To vprašanje je razkrilo manjkajoči trenutek preglednosti. Sistem je moral to štirisekundno čakanje razdeliti na dva različna koraka: »Preverjanje vaše razpoložljivosti«, ki mu je sledilo »Sinhronizacija z urnikom ponudnika«. Ta majhna sprememba je zmanjšala izraženo stopnjo tesnobe uporabnikov. Preglednost ne uspe, ko opisuje le sistemsko dejanje. Vmesnik mora povezati tehnični proces s specifičnim ciljem uporabnika. Zaslon, ki prikazuje »Preverjanje vaše razpoložljivosti«, ne deluje, ker nima konteksta. Uporabnik razume, da AI gleda na koledar, vendar ne ve, zakaj. Dejanje moramo povezati z rezultatom. Sistem mora to štirisekundno čakanje razdeliti na dva različna koraka. Najprej vmesnik prikaže »Preverjanje koledarja za iskanje odprtih ur«. Nato se posodobi na »Sinhronizacija z urnikom ponudnika za zagotovitev vašega termina«. To utemeljuje tehnični proces v dejanskem življenju uporabnika. Razmislite o AI za upravljanje zalog za lokalno kavarno. Sistem naleti na pomanjkanje zalog. Na vmesniku piše "kontakt s prodajalcem" ali "možnosti pregleda" povzroča tesnobo. Upravitelj se sprašuje, ali sistem prekliče naročilo ali kupuje drago alternativo. Boljši pristop je razlaga načrtovanega rezultata: "Ocenjevanje alternativnih dobaviteljev za ohranitev vašega petkovega urnika dostave." To uporabniku natančno pove, kaj poskuša AI doseči. Operacionalizacija revizije Opravili ste revizijo vozlišča odločitev in filtrirali svoj seznam skozi matriko vpliva in tveganja. Zdaj imate seznam bistvenih trenutkov za preglednost. Nato jih morate ustvariti v uporabniškem vmesniku. Ta korak zahteva skupinsko delo v različnih oddelkih. Preglednosti ne morete oblikovati sami z orodjem za oblikovanje. Morate razumeti, kako sistem deluje v zakulisju. Začnite z logičnim pregledom. Srečajte se s svojim vodilnim oblikovalcem sistema. Prinesite svoj zemljevid odločitvenih vozlišč. Potrditi morate, da lahko sistem dejansko deli ta stanja. Pogosto ugotovim, da tehnični sistem ne razkrije točno tistega stanja, ki ga želim prikazati. Inženir bi lahko rekel, da sistem samo vrne splošno "delujoče" stanje. Prizadevati si morate za podrobno posodobitev. Sistem potrebujete za pošiljanje posebnega obvestilako preklopi z branja besedila na preverjanje pravil. Brez te tehnične povezave je vaše zasnove nemogoče zgraditi. Nato vključite ekipo za oblikovanje vsebine. Imate tehnični razlog za dejanje umetne inteligence, vendar potrebujete jasno, človeku prijazno razlago. Inženirji zagotavljajo osnovni proces, oblikovalci vsebine pa zagotavljajo način sporočanja. Ne pišite teh sporočil sami. Razvijalec lahko napiše "Izvaja se funkcija 402", kar je tehnično pravilno, a za uporabnika nesmiselno. Oblikovalec bi lahko napisal "Razmišljanje", kar je prijazno, a preveč nejasno. Vsebinski strateg najde pravo srednjo pot. Ustvarjajo posebne fraze, kot je »Iskanje tveganj odgovornosti«, ki kažejo, da AI deluje, ne da bi zmedli uporabnika. Nazadnje preizkusite preglednost svojih sporočil. Ne čakajte, da bo izdelan končni izdelek, da vidite, ali besedilo deluje. Izvajam primerjalne teste na preprostih prototipih, pri katerih se spremeni le sporočilo o stanju. Na primer, eni skupini (skupina A) pokažem sporočilo, ki pravi "Preverjanje identitete", drugi skupini (skupina B) pa sporočilo, ki pravi "Preverjanje vladnih baz podatkov" (to so izmišljeni primeri, vendar razumete bistvo). Nato jih vprašam, kateri AI se počuti varnejši. Pogosto boste ugotovili, da nekatere besede povzročajo zaskrbljenost, medtem ko druge gradijo zaupanje. Besedilo morate obravnavati kot nekaj, kar morate preizkusiti in dokazati učinkovitost. Kako to spremeni proces oblikovanja Izvajanje teh revizij lahko okrepi način sodelovanja ekipe. Nehamo predajati dovršene oblikovalske datoteke. Začnemo uporabljati neurejene prototipe in skupne preglednice. Osnovno orodje postane matrika preglednosti. Inženirji in oblikovalci vsebin skupaj urejajo to preglednico. Preslikajo natančne tehnične kode v besede, ki jih bo uporabnik prebral. Med pregledom logike se bodo ekipe soočale s trenji. Predstavljajte si, da oblikovalec vpraša inženirja, kako se AI odloči zavrniti transakcijo, predloženo v poročilu o stroških. Inženir bi lahko rekel, da zaledje izpiše samo generično statusno kodo, kot je »Napaka: manjkajoči podatki«. Oblikovalec navaja, da to niso informacije na zaslonu, ki bi jih lahko uporabili. Oblikovalec se pogaja z inženirjem za izdelavo posebne tehnične kljuke. Inženir napiše novo pravilo, tako da sistem sporoči točno tisto, kar manjka, na primer manjkajočo sliko računa. Oblikovalci vsebine v tej fazi delujejo kot prevajalci. Razvijalec lahko napiše tehnično natančen niz, kot je »Izračun praga zaupanja za ujemanje prodajalca«. Oblikovalec vsebine ta niz prevede v besedno zvezo, ki gradi zaupanje za določen rezultat. Strateg jo prepiše kot "Primerjava cen lokalnih prodajalcev, da si zagotovite petkovo dostavo." Uporabnik razume dejanje in rezultat. Celotna medfunkcionalna ekipa sodeluje na sejah uporabniškega testiranja. Gledajo, kako se prava oseba odziva na različna sporočila o statusu. Videti paniko uporabnikov, ker na zaslonu piše "Izvajanje trgovine", ekipo prisili, da ponovno razmisli o svojem pristopu. Inženirji in oblikovalci se strinjajo z boljšim besedilom. Pred nakupom delnic spremenijo besedilo v »Preverjanje zadostnih sredstev«. Skupno testiranje zagotavlja, da končni vmesnik služi sistemski logiki in brezskrbnosti uporabnika. Potreben je čas, da se te dodatne dejavnosti vključijo v koledar ekipe. Vendar bi moral biti končni rezultat ekipa, ki bolj odprto komunicira, in uporabniki, ki bolje razumejo, kaj njihova orodja, ki jih poganja AI, počnejo v njihovem imenu (in zakaj). Ta celostni pristop je temelj oblikovanja resnično zaupanja vrednih izkušenj AI. Zaupanje je izbira oblikovanja Na zaupanje pogosto gledamo kot na čustveni stranski produkt dobre uporabniške izkušnje. Na zaupanje je lažje gledati kot na mehanski rezultat predvidljive komunikacije. Zaupanje gradimo s prikazovanjem pravih informacij ob pravem času. Uničimo ga tako, da preobremenimo uporabnika ali popolnoma skrijemo stroje. Začnite z revizijo vozlišča odločanja, zlasti za agentska orodja in izdelke AI. Poiščite trenutke, ko sistem presodi. Preslikajte te trenutke v matriko tveganja. Če so vložki visoki, odprite škatlo. Pokaži delo. V naslednjem članku si bomo ogledali, kako oblikovati te trenutke: kako napisati kopijo, strukturirati uporabniški vmesnik in obravnavati neizogibne napake, ko se agent zmoti. Dodatek: Kontrolni seznam za revizijo vozlišča odločitev 1. faza: Nastavitev in preslikava ✅ Zberite ekipo: vključite lastnike izdelkov, poslovne analitike, oblikovalce,ključni odločevalci in inženirji, ki so zgradili AI. Namig: Inženirji morajo razložiti dejansko zaledno logiko. Ne poskušajte tega koraka sami. ✅ Narišite celoten postopek: dokumentirajte vsak korak, ki ga opravi AI, od prvega dejanja uporabnika do končnega rezultata. Namig: fizična tabla pogosto najbolje deluje za risanje teh začetnih korakov. Faza 2: Iskanje skrite logike ✅ Poiščite, kje so stvari nejasne: na zemljevidu procesa poiščite vsako mesto, kjer umetna inteligenca primerja možnosti ali vnose, ki nimajo enega popolnega ujemanja. ✅ Določite korake najboljšega ugibanja: Za vsako nejasno mesto preverite, ali sistem uporablja oceno zaupanja. Na primer, vprašajte, ali je sistem 85-odstotno prepričan. To so točke, kjer AI naredi končno izbiro. ✅ Preglejte izbiro: Za vsako točko izbire ugotovite specifično notranjo matematiko ali primerjavo. Primer je ujemanje dela pogodbe s politiko. Drug primer vključuje primerjavo slike pokvarjenega avtomobila s knjižnico fotografij poškodovanega avtomobila. Faza 3: Ustvarjanje uporabniške izkušnje ✅ Napišite jasne razlage: ustvarite sporočila za uporabnika, ki jasno opisujejo določeno notranje dejanje, ki se zgodi, ko se AI odloči. Namig: svoja sporočila utemeljite s konkretno realnostjo. Če AI rezervira sestanek s stranko v lokalni kavarni, povejte uporabniku, da sistem preverja sistem za rezervacije kavarn. ✅ Posodobite zaslon: vnesite te nove, jasne razlage v uporabniški vmesnik. Zamenjajte nejasna sporočila, kot je Pregledovanje pogodb, s svojimi konkretnimi pojasnili. ✅ Preverite zaupanje: poskrbite, da bodo nova sporočila na zaslonu uporabnikom dala preprost razlog za kakršen koli čas čakanja ali rezultat. To naj bi jim dalo občutek samozavesti in zaupanja. Namig: preizkusite ta sporočila z dejanskimi uporabniki, da preverite, ali razumejo določen rezultat, ki je dosežen.