Mae AI Asiantaidd yn barod i drawsnewid profiad cwsmeriaid ac effeithlonrwydd gweithredol, gan olygu bod angen ymagwedd strategol newydd gan arweinyddiaeth. Mae'r esblygiad hwn mewn deallusrwydd artiffisial yn grymuso systemau i gynllunio, cyflawni, a pharhau â thasgau, gan symud y tu hwnt i argymhellion syml i gamau rhagweithiol. Ar gyfer timau UX, rheolwyr cynnyrch, a swyddogion gweithredol, mae deall y newid hwn yn hanfodol ar gyfer datgloi cyfleoedd mewn arloesi, symleiddio llifoedd gwaith, ac ailddiffinio sut mae technoleg yn gwasanaethu pobl. Mae'n hawdd drysu AI Asiantaidd gyda Robotic Process Automation (RPA), sef technoleg sy'n canolbwyntio ar dasgau sy'n seiliedig ar reolau a gyflawnir ar gyfrifiaduron. Mae'r gwahaniaeth yn gorwedd mewn anhyblygedd yn erbyn rhesymu. Mae RPA yn ardderchog am ddilyn sgript gaeth: os digwydd X, gwnewch Y. Mae'n dynwared dwylo dynol. Mae AI Asiantaidd yn dynwared rhesymu dynol. Nid yw'n dilyn sgript llinol; mae'n creu un. Ystyriwch lif gwaith recriwtio. Gall bot RPA sganio crynodeb a'i uwchlwytho i gronfa ddata. Mae'n perfformio tasg ailadroddus yn berffaith. Mae system Asiantaidd yn edrych ar yr ailddechrau, yn sylwi bod yr ymgeisydd yn rhestru ardystiad penodol, yn croesgyfeirio hynny â gofyniad cleient newydd, ac yn penderfynu drafftio e-bost allgymorth personol yn tynnu sylw at y cyfatebiad hwnnw. RPA yn gweithredu cynllun rhagddiffiniedig; Mae AI Asiantaidd yn llunio'r cynllun yn seiliedig ar nod. Mae'r ymreolaeth hon yn gwahanu asiantau oddi wrth yr offer rhagfynegi yr ydym wedi'u defnyddio dros y degawd diwethaf. Enghraifft arall yw rheoli gwrthdaro rhwng cyfarfodydd. Gallai model rhagfynegol sydd wedi'i integreiddio i'ch calendr ddadansoddi amserlen eich cyfarfodydd ac amserlenni eich cydweithwyr. Yna gallai awgrymu gwrthdaro posibl, megis dau gyfarfod pwysig a drefnwyd ar yr un pryd, neu gyfarfod a drefnwyd pan fydd cyfranogwr allweddol ar wyliau. Mae'n rhoi gwybodaeth i chi ac yn tynnu sylw at faterion posibl, ond chi sy'n gyfrifol am weithredu. Byddai AI asiantaidd, yn yr un senario, yn mynd y tu hwnt i ddim ond awgrymu gwrthdaro i'w osgoi. Ar ôl nodi gwrthdaro â chyfranogwr allweddol, gallai’r asiant weithredu drwy:
Gwirio argaeledd yr holl gyfranogwyr angenrheidiol. Nodi slotiau amser amgen sy'n gweithio i bawb. Anfon gwahoddiadau cyfarfod newydd arfaethedig at yr holl fynychwyr. Os yw'r gwrthdaro gyda chyfranogwr allanol, gallai'r asiant ddrafftio ac anfon e-bost yn egluro'r angen i aildrefnu a chynnig amseroedd amgen. Diweddaru eich calendr a chalendrau eich cydweithwyr gyda manylion y cyfarfod newydd ar ôl eu cadarnhau.
Mae'r AI asiantaidd hwn yn deall y nod (datrys y gwrthdaro cyfarfod), yn cynllunio'r camau (gwirio argaeledd, dod o hyd i ddewisiadau eraill, anfon gwahoddiadau), yn gweithredu'r camau hynny, ac yn parhau nes bod y gwrthdaro wedi'i ddatrys, i gyd heb fawr o ymyrraeth uniongyrchol gan ddefnyddwyr. Mae hyn yn dangos y gwahaniaeth “asiantol”: mae'r system yn cymryd camau rhagweithiol ar gyfer y defnyddiwr, yn hytrach na darparu gwybodaeth i'r defnyddiwr yn unig. Mae systemau AI asiant yn deall nod, yn cynllunio cyfres o gamau i'w gyflawni, yn gweithredu'r camau hynny, a hyd yn oed yn addasu os aiff pethau o chwith. Meddyliwch amdano fel cynorthwyydd digidol rhagweithiol. Mae’r dechnoleg waelodol yn aml yn cyfuno modelau iaith mawr (LLMs) ar gyfer deall a rhesymu, ag algorithmau cynllunio sy’n rhannu tasgau cymhleth yn weithredoedd hylaw. Gall yr asiantau hyn ryngweithio ag amrywiol offer, APIs, a hyd yn oed modelau AI eraill i gyflawni eu hamcanion, ac yn hollbwysig, gallant gynnal cyflwr parhaus, sy'n golygu eu bod yn cofio gweithredoedd blaenorol ac yn parhau i weithio tuag at nod dros amser. Mae hyn yn eu gwneud yn sylfaenol wahanol i AI cynhyrchiol nodweddiadol, sydd fel arfer yn cwblhau un cais ac yna'n ailosod. Tacsonomeg Syml o Ymddygiad Asiantaidd Gallwn gategoreiddio ymddygiad asiant yn bedwar dull gwahanol o ymreolaeth. Er bod y rhain yn aml yn edrych fel dilyniant, maent yn gweithredu fel dulliau gweithredu annibynnol. Efallai y bydd defnyddiwr yn ymddiried mewn asiant i weithredu'n annibynnol ar gyfer amserlennu, ond ei gadw yn y “modd awgrymiadau” ar gyfer trafodion ariannol. Daethom i’r lefelau hyn drwy addasu safonau’r diwydiant ar gyfer cerbydau ymreolaethol (lefelau SAE) i gyd-destunau profiad defnyddwyr digidol. Arsylwi-ac-Awgrymu Mae'r asiant yn gweithredu fel monitor. Mae'n dadansoddi ffrydiau data ac yn tynnu sylw at anghysondebau neu gyfleoedd, ond nid yw'n cymryd unrhyw gamau. Gwahaniaethu Yn wahanol i'r lefel nesaf, nid yw'r asiant yn cynhyrchu unrhyw gynllun cymhleth. Mae’n pwyntio at broblem. Enghraifft Mae asiant DevOps yn sylwi ar bigyn CPU gweinydd ac yn rhybuddio'r peiriannydd ar alwad. Nid yw'n gwybod sut nac yn ceisio ei drwsio, ond mae'n gwybod bod rhywbeth o'i le. Goblygiadau ar gyfer dylunio a goruchwylioAr y lefel hon,dylai dylunio a throsolwg flaenoriaethu hysbysiadau clir, nad ydynt yn ymwthiol a phroses wedi'i diffinio'n dda i ddefnyddwyr weithredu ar awgrymiadau. Mae'r ffocws ar rymuso'r defnyddiwr gyda gwybodaeth amserol a pherthnasol heb gymryd rheolaeth. Dylai ymarferwyr UX ganolbwyntio ar wneud awgrymiadau'n glir ac yn hawdd eu deall, tra bod angen i reolwyr cynnyrch sicrhau bod y system yn darparu gwerth heb orlethu'r defnyddiwr. Cynllun-a-Cynnig Mae'r asiant yn nodi nod ac yn cynhyrchu strategaeth aml-gam i'w gyflawni. Mae'n cyflwyno'r cynllun llawn ar gyfer adolygiad dynol. GwahaniaethuMae'r asiant yn gweithredu fel strategydd. Nid yw'n gweithredu; mae'n aros am gymeradwyaeth ar gyfer y dull cyfan. Enghraifft Mae'r un asiant DevOps yn sylwi ar bigyn y CPU, yn dadansoddi'r logiau, ac yn cynnig cynllun adfer:
Trowch ddau enghraifft ychwanegol. Ailgychwyn y cydbwysedd llwyth. Archifo hen logiau.
Mae'r dynol yn adolygu'r rhesymeg ac yn clicio ar “Cymeradwyo Cynllun”. Goblygiadau ar gyfer dylunio a goruchwylio I asiantau sy'n cynllunio ac yn cynnig, rhaid i ddylunio sicrhau bod y cynlluniau arfaethedig yn hawdd eu deall a bod gan ddefnyddwyr ffyrdd greddfol i'w haddasu neu eu gwrthod. Mae goruchwyliaeth yn hanfodol wrth fonitro ansawdd cynigion a rhesymeg cynllunio'r asiant. Dylai ymarferwyr UX ddylunio delweddu clir o'r cynlluniau arfaethedig, a rhaid i reolwyr cynnyrch sefydlu llifoedd gwaith adolygu a chymeradwyo clir. Deddf-gyda-Cadarnhad Mae'r asiant yn cwblhau'r holl waith paratoi ac yn gosod y cam olaf mewn cyflwr graddol. Mae'n dal y drws ar agor i bob pwrpas, gan aros am amnaid. Gwahaniaethu Mae hyn yn wahanol i “Cynllunio a Chynnig” oherwydd bod y gwaith eisoes wedi'i wneud a'i lwyfannu. Mae'n lleihau ffrithiant. Mae'r defnyddiwr yn cadarnhau'r canlyniad, nid y strategaeth. Enghraifft Mae asiant recriwtio yn drafftio pum gwahoddiad cyfweliad, yn canfod amseroedd agored ar galendrau, ac yn creu digwyddiadau calendr. Mae'n cyflwyno botwm "Anfon Pawb". Mae'r defnyddiwr yn darparu'r awdurdodiad terfynol i sbarduno'r gweithredu allanol. Goblygiadau ar gyfer dylunio a goruchwylio Pan fydd asiantiaid yn gweithredu gyda chadarnhad, dylai'r dyluniad ddarparu crynodebau tryloyw a chryno o'r camau a fwriedir, gan amlinellu'n glir y canlyniadau posibl. Mae angen i oruchwyliaeth wirio bod y broses gadarnhau yn gadarn ac na ofynnir i ddefnyddwyr gymeradwyo gweithredoedd yn ddall. Dylai ymarferwyr UX ddylunio ysgogiadau cadarnhau sy'n glir ac yn darparu'r holl wybodaeth angenrheidiol, a dylai rheolwyr cynnyrch flaenoriaethu trywydd archwilio cadarn ar gyfer yr holl gamau gweithredu a gadarnhawyd. Act-Annibynnol Mae'r asiant yn cyflawni tasgau'n annibynnol o fewn ffiniau diffiniedig. Gwahaniaethu Mae'r defnyddiwr yn adolygu hanes gweithredoedd, nid y gweithredoedd eu hunain. Enghraifft Mae'r asiant recriwtio yn gweld gwrthdaro, yn symud y cyfweliad i slot wrth gefn, yn diweddaru'r ymgeisydd, ac yn hysbysu'r rheolwr cyflogi. Dim ond hysbysiad y mae'r bod dynol yn ei weld: Cyfweliad wedi'i aildrefnu i ddydd Mawrth. Goblygiadau ar gyfer dylunio a goruchwylio Ar gyfer asiantau ymreolaethol, mae angen i'r dyluniad sefydlu ffiniau clir a gymeradwyir ymlaen llaw a darparu offer monitro cadarn. Mae goruchwyliaeth yn gofyn am werthusiad parhaus o berfformiad yr asiant o fewn y ffiniau hyn, angen hanfodol am logio cadarn, mecanweithiau diystyru clir, a switshis lladd wedi'u diffinio gan ddefnyddwyr i gynnal rheolaeth ac ymddiriedaeth defnyddwyr. Dylai ymarferwyr UX ganolbwyntio ar ddylunio dangosfyrddau effeithiol ar gyfer monitro ymddygiad asiant ymreolaethol, a rhaid i reolwyr cynnyrch sicrhau bod llywodraethu clir a chanllawiau moesegol ar waith.
Gadewch i ni edrych ar gymhwysiad byd go iawn mewn technoleg AD i weld y dulliau hyn ar waith. Ystyriwch “Asiant Cydlynu Cyfweliad” sydd wedi'i gynllunio i drin logisteg llogi.
Ym Modd Awgrym Mae'r asiant yn sylwi bod cyfwelydd wedi'i fwcio ddwywaith. Mae’n tynnu sylw at y gwrthdaro ar ddangosfwrdd y recriwtiwr: “Rhybudd: Mae gan Sarah archeb ddwbl ar gyfer y cyfweliad 2 PM.” Yn Modd Cynllun Mae'r asiant yn dadansoddi calendr Sarah ac argaeledd yr ymgeisydd. Mae’n cyflwyno ateb: “Rwy’n argymell symud y cyfweliad i ddydd Iau am 10 AM. Mae hyn yn golygu symud Sarah’s 1:1 gyda’i rheolwr.” Mae'r recriwtiwr yn adolygu'r rhesymeg hon. Yn y Modd Cadarnhau Mae'r asiant yn drafftio'r e-byst at yr ymgeisydd a'r rheolwr. Mae'n llenwi'r gwahoddiadau calendr. Mae'r recriwtiwr yn gweld crynodeb: "Barod i aildrefnu i ddydd Iau. Anfon diweddariadau?" Mae'r recriwtiwr yn clicio "Cadarnhau." Mewn Modd Ymreolaethol Mae'r asiant yn delio â'r gwrthdaro ar unwaith. Mae’n parchu rheol a osodwyd ymlaen llaw: “Blaenoriaethu cyfweliadau ymgeiswyr bob amser dros gyfweliadau 1:1 mewnol.” Mae'n symud y cyfarfod ac yn anfon yr hysbysiadau. Mae'r recriwtiwr yn gweld cofnod log: “Penderfynwydgwrthdaro amserlen ar gyfer Ymgeisydd B.”
Primer Ymchwil: Beth i'w Ymchwilio A Sut Mae datblygu AI asiantaidd effeithiol yn gofyn am ddull ymchwil unigryw o gymharu â meddalwedd traddodiadol neu hyd yn oed AI cynhyrchiol. Mae natur ymreolaethol asiantau AI, eu gallu i wneud penderfyniadau, a'u potensial ar gyfer gweithredu rhagweithiol yn gofyn am fethodolegau arbenigol ar gyfer deall disgwyliadau defnyddwyr, mapio ymddygiadau asiant cymhleth, a rhagweld methiannau posibl. Mae'r paent preimio ymchwil canlynol yn amlinellu dulliau allweddol o fesur a gwerthuso'r agweddau unigryw hyn ar AI asiantaidd. Cyfweliadau Model Meddyliol Mae'r cyfweliadau hyn yn datgelu syniadau rhagdybiedig defnyddwyr ynghylch sut y dylai asiant AI ymddwyn. Yn hytrach na gofyn yn syml beth mae defnyddwyr ei eisiau, mae'r ffocws ar ddeall eu modelau mewnol o alluoedd a chyfyngiadau'r asiant. Dylem osgoi defnyddio’r gair “asiant” gyda chyfranogwyr. Mae'n cario bagiau ffuglen wyddonol neu'n derm sy'n rhy hawdd ei ddrysu ag asiant dynol sy'n cynnig cefnogaeth neu wasanaethau. Yn lle hynny, fframiwch y drafodaeth o amgylch “cynorthwywyr” neu “y system.” Mae angen i ni ddarganfod lle mae defnyddwyr yn tynnu'r llinell rhwng awtomeiddio defnyddiol a rheolaeth ymwthiol.
Dull: Gofynnwch i ddefnyddwyr ddisgrifio, lluniadu, neu adrodd eu rhyngweithiadau disgwyliedig gyda'r asiant mewn amrywiol senarios damcaniaethol. Ymchwilwyr Allweddol (gan adlewyrchu amrywiaeth o ddiwydiannau): I ddeall ffiniau awtomeiddio dymunol a phryderon posibl ynghylch gor-awtomatiaeth, gofynnwch: Os caiff eich taith awyren ei chanslo, beth hoffech chi i'r system ei wneud yn awtomatig? Beth fyddai'n eich poeni pe bai'n gwneud hynny heb eich cyfarwyddyd penodol?
Er mwyn archwilio dealltwriaeth y defnyddiwr o brosesau mewnol yr asiant a chyfathrebu angenrheidiol, gofynnwch: Dychmygwch fod cynorthwyydd digidol yn rheoli'ch cartref craff. Os caiff pecyn ei ddosbarthu, pa gamau ydych chi'n dychmygu y bydd yn eu cymryd, a pha wybodaeth y byddech chi'n disgwyl ei chael?
I ddatgelu disgwyliadau ynghylch rheolaeth a chaniatâd o fewn proses aml-gam, gofynnwch: Os gofynnwch i'ch cynorthwyydd digidol drefnu cyfarfod, pa gamau ydych chi'n rhagweld y bydd yn eu cymryd? Ar ba adegau y byddech am i ni ymgynghori â chi neu gael dewisiadau?
Manteision y dull: Yn datgelu rhagdybiaethau ymhlyg, yn tynnu sylw at feysydd lle gallai ymddygiad arfaethedig yr asiant wyro oddi wrth ddisgwyliadau defnyddwyr, ac yn llywio dyluniad rheolaethau a mecanweithiau adborth priodol.
Mapio Taith Asiant: Yn debyg i fapio teithiau defnyddiwr traddodiadol, mae mapio teithiau asiant yn canolbwyntio'n benodol ar gamau gweithredu a phwyntiau penderfynu disgwyliedig yr asiant AI ei hun, ochr yn ochr â rhyngweithio'r defnyddiwr. Mae hyn yn helpu i nodi peryglon posibl yn rhagweithiol.
Dull: Creu map gweledol sy'n amlinellu'r gwahanol gamau yng ngweithrediad asiant, o'r cychwyn i'r diwedd, gan gynnwys yr holl gamau gweithredu posibl, penderfyniadau, a rhyngweithiadau â systemau neu ddefnyddwyr allanol. Elfennau Allweddol i'r Mapio: Camau Gweithredu'r Asiant: Pa dasgau neu benderfyniadau penodol y mae'r asiant yn eu cyflawni? Mewnbynnau/Allbynnau Gwybodaeth: Pa ddata sydd ei angen ar yr asiant, a pha wybodaeth y mae'n ei chynhyrchu neu'n ei chyfleu? Pwyntiau Penderfynu: Ble mae'r asiant yn gwneud dewisiadau, a beth yw'r meini prawf ar gyfer y dewisiadau hynny? Pwyntiau Rhyngweithio Defnyddiwr: Ble mae'r defnyddiwr yn darparu mewnbwn, adolygu, neu gymeradwyo gweithredoedd? Pwyntiau o Fethu: Yn hollbwysig, nodwch achosion penodol lle gallai'r asiant gamddehongli cyfarwyddiadau, gwneud penderfyniad anghywir, neu ryngweithio â'r endid anghywir. Enghreifftiau: Derbynnydd anghywir (e.e., anfon gwybodaeth sensitif at y person anghywir), gorddrafft (e.e., taliad awtomataidd sy’n fwy na’r arian sydd ar gael), camddehongli bwriad (e.e., archebu taith awyren ar y dyddiad anghywir oherwydd iaith amwys).
Llwybrau Adfer: Sut gall yr asiant neu'r defnyddiwr wella o'r methiannau hyn? Pa fecanweithiau sydd ar waith ar gyfer cywiro neu ymyrryd?
Manteision y dull: Yn darparu golwg gyfannol o lif gweithredol yr asiant, yn datgelu dibyniaethau cudd, ac yn caniatáu ar gyfer dylunio rhagweithiol o fesurau diogelu, trin gwallau, a phwyntiau ymyrraeth defnyddwyr i atal neu liniaru canlyniadau negyddol.
Profion Camymddwyn Efelychus: Mae'r dull hwn wedi'i gynllunio i brofi straen ar y system ac arsylwi ar adweithiau defnyddwyr pan fydd yr asiant AI yn methu neu'n gwyro oddi wrth ddisgwyliadau. Mae'n ymwneud â deall atgyweirio ymddiriedaeth ac ymatebion emosiynol mewn sefyllfaoedd anffafriol.
Dull: Mewn astudiaethau labordy rheoledig, cyflwynwch senarios yn fwriadol lle mae'r asiant yn gwneud camgymeriad, yn camddehongli gorchymyn, neu'n ymddwyn yn annisgwyl. Mathau o “Camymddwyn” i'w Efelychu: GorchymynCamddehongli: Mae'r asiant yn cyflawni gweithred ychydig yn wahanol i'r hyn a fwriadwyd gan y defnyddiwr (e.e., archebu dwy eitem yn lle un). Gorlwytho/Tanlwytho Gwybodaeth: Mae'r asiant yn darparu gormod o wybodaeth amherthnasol neu ddim digon o fanylion hanfodol. Gweithredu Digymell: Mae'r asiant yn cymryd cam nad oedd y defnyddiwr yn ei ddymuno nac yn ei ddisgwyl yn benodol (e.e. prynu stoc heb gymeradwyaeth). Methiant System: Mae'r asiant yn damwain, yn dod yn anymatebol, neu'n darparu neges gwall. Cyfyng-gyngor Moesegol: Mae'r asiant yn gwneud penderfyniad sydd â goblygiadau moesegol (e.e., blaenoriaethu un dasg dros y llall yn seiliedig ar fetrig nas rhagwelwyd).
Ffocws arsylwi: Ymatebion Defnyddwyr: Sut mae defnyddwyr yn ymateb yn emosiynol (rhwystredigaeth, dicter, dryswch, colli ymddiriedaeth)? Ymdrechion Adfer: Pa gamau y mae defnyddwyr yn eu cymryd i gywiro ymddygiad yr asiant neu ddadwneud ei weithredoedd? Mecanweithiau Trwsio Ymddiriedolaeth: A yw mecanweithiau adfer neu adborth integredig y system yn helpu i adfer ymddiriedaeth? Sut mae defnyddwyr am gael gwybod am wallau? Symud Model Meddyliol: A yw'r camymddwyn yn newid dealltwriaeth y defnyddiwr o alluoedd neu gyfyngiadau'r asiant?
Manteision y dull: Hanfodol ar gyfer nodi bylchau dylunio sy'n ymwneud ag adfer gwallau, adborth, a rheolaeth defnyddwyr. Mae'n rhoi cipolwg ar ba mor wydn yw defnyddwyr i fethiannau asiant a'r hyn sydd ei angen i gynnal neu ailadeiladu ymddiriedaeth, gan arwain at systemau asiantaidd mwy cadarn a maddeugar.
Trwy integreiddio'r methodolegau ymchwil hyn, gall ymarferwyr UX symud y tu hwnt i wneud systemau asiantaidd yn hawdd eu defnyddio i'w gwneud yn ddibynadwy, yn rheoladwy ac yn atebol, gan feithrin perthynas gadarnhaol a chynhyrchiol rhwng defnyddwyr a'u hasiantau AI. Sylwch nad dyma'r unig ddulliau sy'n berthnasol i archwilio AI asiantaidd yn effeithiol. Mae llawer o ddulliau eraill yn bodoli, ond mae'r rhain yn fwyaf hygyrch i ymarferwyr yn y tymor agos. Rwyf eisoes wedi ymdrin â dull Wizard of Oz, dull ychydig yn fwy datblygedig o brofi cysyniad, sydd hefyd yn arf gwerthfawr ar gyfer archwilio cysyniadau AI asiantaidd. Ystyriaethau Moesegol Mewn Methodoleg Ymchwil Wrth ymchwilio i AI asiantaidd, yn enwedig wrth efelychu camymddwyn neu wallau, mae ystyriaethau moesegol yn allweddol i'w hystyried. Mae yna lawer o gyhoeddiadau sy'n canolbwyntio ar ymchwil UX moesegol, gan gynnwys erthygl a ysgrifennais ar gyfer Smashing Magazine, y canllawiau hyn gan Sefydliad Dylunio UX, a'r dudalen hon o'r Pecyn Cymorth Dylunio Cynhwysol. Metrigau Allweddol ar gyfer AI Asiantaidd Bydd angen set gynhwysfawr o fetrigau allweddol arnoch i asesu perfformiad a dibynadwyedd systemau AI asiantaidd yn effeithiol. Mae'r metrigau hyn yn rhoi mewnwelediad i ymddiriedaeth defnyddwyr, cywirdeb system, a phrofiad cyffredinol y defnyddiwr. Trwy olrhain y dangosyddion hyn, gall datblygwyr a dylunwyr nodi meysydd i'w gwella a sicrhau bod asiantau AI yn gweithredu'n ddiogel ac yn effeithlon. 1. Cyfradd YmyrraethAr gyfer asiantau ymreolaethol, rydym yn mesur llwyddiant trwy dawelwch. Os yw asiant yn cyflawni tasg ac nad yw'r defnyddiwr yn ymyrryd nac yn gwrthdroi'r weithred o fewn ffenestr osod (e.e., 24 awr), rydym yn cyfrif hynny fel derbyniad. Rydym yn olrhain y Gyfradd Ymyrraeth: pa mor aml mae dynol yn neidio i mewn i atal neu gywiro'r asiant? Mae cyfradd ymyrraeth uchel yn arwydd o gamaliniad mewn ymddiriedaeth neu resymeg. 2. Amlder Camau Gweithredu Anfwriadol fesul 1,000 o DasgauMae'r metrig critigol hwn yn meintioli nifer y camau gweithredu a gyflawnwyd gan yr asiant AI nad oedd y defnyddiwr yn ei ddymuno nac yn ei ddisgwyl, wedi'u normaleiddio fesul 1,000 o dasgau a gwblhawyd. Mae amlder isel o gamau anfwriadol yn dynodi AI wedi'i alinio'n dda sy'n dehongli bwriad defnyddwyr yn gywir ac yn gweithredu o fewn ffiniau diffiniedig. Mae'r metrig hwn yn gysylltiedig yn agos â dealltwriaeth yr AI o'r cyd-destun, ei allu i ddadamwyso gorchmynion, a chadernid ei brotocolau diogelwch. 3. Cyfraddau Dychwelyd neu Ddadwneud Mae'r metrig hwn yn olrhain pa mor aml y mae angen i ddefnyddwyr wrthdroi neu ddadwneud gweithred a gyflawnir gan yr AI. Mae cyfraddau dychwelyd uchel yn awgrymu bod yr AI yn gwneud gwallau aml, yn camddehongli cyfarwyddiadau, neu'n gweithredu mewn ffyrdd nad ydynt yn cyd-fynd â disgwyliadau defnyddwyr. Gall dadansoddi'r rhesymau y tu ôl i'r dychweliadau hyn roi adborth gwerthfawr ar gyfer gwella algorithmau'r AI, dealltwriaeth o ddewisiadau defnyddwyr, a'i allu i ragweld canlyniadau dymunol. Er mwyn deall pam, mae'n rhaid i chi roi micro-arolwg ar waith ar y cam dadwneud. Er enghraifft, pan fydd defnyddiwr yn gwrthdroi newid amserlen, gall anogwr syml ofyn: "Amser anghywir? Person anghywir? Neu a oeddech chi eisiau ei wneud eich hun?" Caniatáu i'r defnyddiwr glicio ar yr opsiwn sy'n cyfateb orau i'w rhesymeg. 4. Amser i Ddatrys Ar Ôl ErrorThis metrigyn mesur yr hyd y mae'n ei gymryd i ddefnyddiwr gywiro gwall a wnaed gan yr AI neu i'r system AI ei hun adfer o gyflwr gwallus. Mae amser byr i'w ddatrys yn dynodi proses adfer gwallau effeithlon a hawdd ei defnyddio, a all liniaru rhwystredigaeth defnyddwyr a chynnal cynhyrchiant. Mae hyn yn cynnwys pa mor hawdd yw adnabod y gwall, hygyrchedd mecanweithiau dadwneud neu gywiro, ac eglurder negeseuon gwall a ddarperir gan yr AI.
Mae casglu'r metrigau hyn yn gofyn am offeru'ch system i olrhain IDau Gweithredu Asiant. Rhaid i bob cam gweithredu penodol y mae'r asiant yn ei gymryd, megis cynnig amserlen neu archebu taith awyren, gynhyrchu ID unigryw sy'n parhau yn y logiau. I fesur y Gyfradd Ymyrraeth, nid ydym yn edrych am ymateb defnyddiwr ar unwaith. Edrychwn am absenoldeb gwrth-weithredu o fewn ffenestr ddiffiniedig. Os cynhyrchir ID Gweithredu am 9:00 AM ac nad oes unrhyw ddefnyddiwr dynol yn addasu neu'n dychwelyd yr ID penodol hwnnw erbyn 9:00 AM drannoeth, mae'r system yn ei dagio'n Dderbyniol yn rhesymegol. Mae hyn yn ein galluogi i fesur llwyddiant yn seiliedig ar dawelwch defnyddiwr yn hytrach na chadarnhad gweithredol. Ar gyfer Cyfraddau Dychwelyd, mae cyfrifon amrwd yn annigonol oherwydd nad oes ganddynt gyd-destun. I ddal y rheswm sylfaenol, rhaid i chi weithredu rhesymeg rhyng-gipio ar swyddogaethau Dadwneud neu Ddychwelyd eich cais. Pan fydd defnyddiwr yn gwrthdroi gweithred a gychwynnwyd gan asiant, ysgogwch ficro-arolwg ysgafn. Gall hwn fod yn foddol tri opsiwn syml yn gofyn i'r defnyddiwr gategoreiddio'r gwall fel un ffeithiol anghywir, heb gyd-destun, neu'n ddewis syml i drin y dasg â llaw. Mae hyn yn cyfuno telemetreg feintiol gyda mewnwelediad ansoddol. Mae'n galluogi timau peirianneg i wahaniaethu rhwng algorithm sydd wedi torri a diffyg cyfatebiaeth dewis defnyddiwr. Mae'r metrigau hyn, o'u holrhain yn gyson a'u dadansoddi'n gyfannol, yn darparu fframwaith cadarn ar gyfer gwerthuso perfformiad systemau AI asiantaidd, gan ganiatáu ar gyfer gwelliant parhaus mewn rheolaeth, caniatâd ac atebolrwydd. Dylunio yn Erbyn Twyll Wrth i asiantau ddod yn fwyfwy galluog, rydym yn wynebu risg newydd: Llaid Asiantaidd. Mae llaid traddodiadol yn creu ffrithiant sy'n ei gwneud hi'n anodd canslo tanysgrifiad neu ddileu cyfrif. Mae llaid asiantaidd yn gweithredu i'r gwrthwyneb. Mae'n dileu ffrithiant i nam, gan ei gwneud yn rhy hawdd i ddefnyddiwr gytuno i weithred sydd o fudd i'r busnes yn hytrach na'i fuddiannau ei hun. Ystyriwch asiant sy'n cynorthwyo gydag archebu teithiau. Heb reiliau gwarchod clir, gallai'r system flaenoriaethu cwmni hedfan partner neu westy ymyl uwch. Mae'n cyflwyno'r dewis hwn fel y llwybr gorau posibl. Mae'r defnyddiwr, gan ymddiried yn awdurdod y system, yn derbyn yr argymhelliad heb graffu. Mae hyn yn creu patrwm twyllodrus lle mae'r system yn optimeiddio ar gyfer refeniw dan gochl cyfleustra. Y Risg O Gymhwysedd Wedi'i Ddychmygu'n Anghywir Efallai na fydd twyll yn deillio o fwriad maleisus. Mae'n aml yn amlygu mewn AI fel Cymhwysedd Dychmygol. Mae Modelau Iaith Mawr yn aml yn swnio'n awdurdodol hyd yn oed pan fyddant yn anghywir. Maent yn cyflwyno cadarnhad archeb ffug neu grynodeb anghywir gyda'r un hyder â ffaith wedi'i dilysu. Efallai y bydd defnyddwyr yn naturiol yn ymddiried yn y tôn hyderus hon. Mae'r diffyg cyfatebiaeth hwn yn creu bwlch peryglus rhwng gallu system a disgwyliadau defnyddwyr. Rhaid inni ddylunio’n benodol i bontio’r bwlch hwn. Os bydd asiant yn methu â chwblhau tasg, rhaid i'r rhyngwyneb nodi'r methiant hwnnw'n glir. Os yw’r system yn ansicr, rhaid iddi fynegi ansicrwydd yn hytrach na’i chuddio â rhyddiaith gaboledig. Tryloywder trwy Primitives Tarddiad yw'r gwrthwenwyn i slwtsh a rhithwelediad. Mae angen tag metadata penodol ar gyfer pob gweithred ymreolaethol sy'n esbonio tarddiad y penderfyniad. Mae angen y gallu ar ddefnyddwyr i archwilio'r gadwyn resymeg y tu ôl i'r canlyniad. Er mwyn cyflawni hyn, rhaid inni drosi cyntefig yn atebion ymarferol. Mewn peirianneg meddalwedd, mae cyntefigion yn cyfeirio at yr unedau gwybodaeth craidd neu'r gweithredoedd y mae asiant yn eu cyflawni. I'r peiriannydd, mae hyn yn edrych fel galwad API neu giât rhesymeg. I'r defnyddiwr, rhaid iddo ymddangos fel esboniad clir. Yr her ddylunio yw mapio'r camau technegol hyn i resymeg y gall pobl eu darllen. Os yw asiant yn argymell taith hedfan benodol, mae angen i'r defnyddiwr wybod pam. Ni all y rhyngwyneb guddio y tu ôl i awgrym generig. Rhaid iddo amlygu'r cyntefig gwaelodol: Rhesymeg: Rhatach_Direct_Flight neu Logic: Partner_Airline_Priority. Mae Ffigur 4 yn dangos y llif cyfieithu hwn. Rydym yn cymryd y system amrwd yn gyntefig - y rhesymeg cod gwirioneddol - ac yn ei fapio i linyn sy'n wynebu'r defnyddiwr. Er enghraifft, mae cyntefig yn gwirio amserlen galendr cyfarfod yn dod yn ddatganiad clir: rydw i wedi cynnig 4 PMcyfarfod. Mae'r lefel hon o dryloywder yn sicrhau bod gweithredoedd yr asiant yn ymddangos yn rhesymegol ac yn fuddiol. Mae'n caniatáu i'r defnyddiwr wirio bod yr asiant wedi gweithredu er eu lles gorau. Trwy ddatgelu'r cyntefig, rydym yn trawsnewid blwch du yn flwch gwydr, gan sicrhau bod defnyddwyr yn parhau i fod yr awdurdod terfynol ar eu bywydau digidol eu hunain.
Gosod Y Llwyfan ar gyfer Dylunio Mae adeiladu system asiantaidd yn gofyn am lefel newydd o ddealltwriaeth seicolegol ac ymddygiadol. Mae'n ein gorfodi i symud y tu hwnt i brofion defnyddioldeb confensiynol ac i fyd ymddiriedaeth, caniatâd ac atebolrwydd. Mae’r dulliau ymchwil rydyn ni wedi’u trafod, o archwilio modelau meddyliol i efelychu camymddwyn a sefydlu metrigau newydd, yn darparu sylfaen angenrheidiol. Yr arferion hyn yw'r offer hanfodol ar gyfer nodi'n rhagweithiol lle gallai system ymreolaethol fethu ac, yn bwysicach fyth, sut i atgyweirio'r berthynas defnyddiwr-asiant pan fydd yn gwneud hynny. Mae'r newid i AI asiantaidd yn ailddiffiniad o'r berthynas defnyddiwr-system. Nid ydym bellach yn dylunio ar gyfer offer sy'n ymateb i orchmynion yn unig; rydym yn dylunio ar gyfer partneriaid sy'n gweithredu ar ein rhan. Mae hyn yn newid y dyluniad hanfodol o effeithlonrwydd a rhwyddineb defnydd i dryloywder, rhagweladwyedd, a rheolaeth. Pan fydd AI yn gallu archebu hediad neu fasnachu stoc heb glic terfynol, mae dyluniad ei “rampiau ar y rampiau” ac “oddi ar y rampiau” yn dod yn hollbwysig. Ein cyfrifoldeb ni yw sicrhau bod defnyddwyr yn teimlo eu bod yn sedd y gyrrwr, hyd yn oed pan fyddant wedi trosglwyddo’r olwyn. Mae'r realiti newydd hwn hefyd yn dyrchafu rôl yr ymchwilydd UX. Rydym yn dod yn geidwaid ymddiriedaeth defnyddwyr, gan weithio ar y cyd â pheirianwyr a rheolwyr cynnyrch i ddiffinio a phrofi rheiliau gwarchod ymreolaeth asiant. Y tu hwnt i fod yn ymchwilwyr, rydym yn dod yn eiriolwyr dros reolaeth defnyddwyr, tryloywder, a'r mesurau diogelu moesegol o fewn y broses ddatblygu. Trwy drosi cyntefig yn gwestiynau ymarferol ac efelychu senarios gwaethaf, gallwn adeiladu systemau cadarn sy'n bwerus ac yn ddiogel. Mae'r erthygl hon wedi amlinellu “beth” a “pham” ymchwilio i AI asiantaidd. Mae wedi dangos bod ein pecynnau cymorth traddodiadol yn annigonol a bod yn rhaid inni fabwysiadu methodolegau newydd, blaengar. Bydd yr erthygl nesaf yn adeiladu ar y sylfaen hon, gan ddarparu'r patrymau dylunio penodol a'r arferion sefydliadol sy'n gwneud cyfleustodau asiant yn dryloyw i ddefnyddwyr, gan sicrhau y gallant harneisio pŵer AI asiantaidd gyda hyder a rheolaeth. Mae dyfodol UX yn ymwneud â gwneud systemau yn ddibynadwy. I gael dealltwriaeth ychwanegol o AI asiantaidd, gallwch archwilio'r adnoddau canlynol:
Blog Google AI ar Asiant AI Ymchwil Microsoft ar Asiantau AI