Agent AI, liderlikdən yeni strateji yanaşma tələb edən müştəri təcrübəsini və əməliyyat səmərəliliyini dəyişdirməyə hazırdır. Süni intellektdəki bu təkamül sistemlərə tapşırıqları planlaşdırmaq, yerinə yetirmək və israrlı olmaq imkanı verir, sadə tövsiyələrdən kənara çıxaraq proaktiv fəaliyyətə keçir. UX komandaları, məhsul menecerləri və menecerlər üçün bu dəyişikliyi başa düşmək innovasiyalarda imkanların açılması, iş axınlarının sadələşdirilməsi və texnologiyanın insanlara necə xidmət etdiyini yenidən müəyyən etmək üçün çox vacibdir. Agentic AI-ni kompüterlərdə yerinə yetirilən qaydalara əsaslanan tapşırıqlara diqqət yetirən texnologiya olan Robotik Proseslərin Avtomatlaşdırılması (RPA) ilə qarışdırmaq asandır. Fərqlilik mülahizə ilə sərtlikdə olur. RPA ciddi bir skriptə əməl etməkdə əladır: X olarsa, Y edin. İnsan əllərini təqlid edir. Agent AI insan düşüncəsini təqlid edir. O, xətti skriptə əməl etmir; birini yaradır. İşə qəbul iş prosesini nəzərdən keçirin. RPA botu CV-ni skan edə və verilənlər bazasına yükləyə bilər. Təkrarlanan bir işi mükəmməl yerinə yetirir. Agentlik sistemi CV-yə baxır, namizədin xüsusi sertifikatı siyahıya aldığını, yeni müştəri tələbi ilə çarpaz arayışları qeyd edir və bu uyğunluğu vurğulayan fərdiləşdirilmiş məlumat e-poçtu hazırlamağa qərar verir. RPA əvvəlcədən müəyyən edilmiş planı icra edir; Agent AI planı məqsədə əsaslanan formalaşdırır. Bu muxtariyyət agentləri son on ildə istifadə etdiyimiz proqnozlaşdırıcı vasitələrdən ayırır. Başqa bir misal görüş münaqişələrini idarə etməkdir. Təqviminizə inteqrasiya olunmuş proqnozlaşdırıcı model görüş cədvəlinizi və həmkarlarınızın cədvəllərini təhlil edə bilər. Daha sonra o, eyni vaxtda planlaşdırılan iki mühüm görüş və ya əsas iştirakçı tətildə olan zaman planlaşdırılan görüş kimi potensial münaqişələri təklif edə bilər. O, sizə məlumat verir və potensial problemləri qeyd edir, lakin siz hərəkətə keçməyə cavabdehsiniz. Agent AI, eyni ssenaridə, qarşısını almaq üçün münaqişələri təklif etməkdən kənara çıxacaq. Əsas iştirakçı ilə ziddiyyəti müəyyən etdikdən sonra agent aşağıdakılarla hərəkət edə bilər:

Bütün zəruri iştirakçıların mövcudluğunun yoxlanılması. Hər kəs üçün işləyən alternativ vaxt intervallarının müəyyən edilməsi. Bütün iştirakçılara təklif olunan yeni görüş dəvətnamələrinin göndərilməsi. Münaqişə xarici iştirakçı ilə olarsa, agent yenidən planlaşdırma ehtiyacını izah edən və alternativ vaxtlar təklif edən e-məktub hazırlaya və göndərə bilər. Təsdiq edildikdən sonra təqviminizin və həmkarlarınızın təqvimlərinin yeni görüş təfərrüatları ilə yenilənməsi.

Bu agent AI məqsədi başa düşür (görüş münaqişəsinin həlli), addımları planlaşdırır (mövcudluğun yoxlanılması, alternativlərin tapılması, dəvətlərin göndərilməsi), bu addımları yerinə yetirir və münaqişə həll olunana qədər davam edir, hamısı minimal birbaşa istifadəçi müdaxiləsi ilə. Bu, “agent” fərqini nümayiş etdirir: sistem istifadəçiyə məlumat verməkdənsə, istifadəçi üçün proaktiv addımlar atır. Agentlik süni intellekt sistemləri bir məqsədi başa düşür, ona çatmaq üçün bir sıra addımlar planlaşdırır, bu addımları yerinə yetirir və hətta işlərin səhv getdiyi halda uyğunlaşır. Bunu proaktiv rəqəmsal köməkçi kimi düşünün. Əsas texnologiya çox vaxt başa düşmək və əsaslandırmaq üçün böyük dil modellərini (LLM) kompleks tapşırıqları idarə edilə bilən hərəkətlərə ayıran planlaşdırma alqoritmləri ilə birləşdirir. Bu agentlər məqsədlərinə çatmaq üçün müxtəlif alətlər, API-lər və hətta digər süni intellekt modelləri ilə qarşılıqlı əlaqədə ola bilər və tənqidi olaraq onlar davamlı vəziyyəti saxlaya bilərlər, yəni əvvəlki hərəkətləri xatırlayırlar və zamanla məqsədə doğru işləməyə davam edirlər. Bu, onları adətən bir sorğunu tamamlayan və sonra sıfırlayan tipik generativ AI-dən əsaslı şəkildə fərqləndirir. Agent Davranışlarının Sadə Taksonomiyası Agent davranışını dörd fərqli muxtariyyət rejiminə təsnif edə bilərik. Bunlar tez-tez irəliləyiş kimi görünsə də, müstəqil iş rejimləri kimi fəaliyyət göstərirlər. İstifadəçi agentə planlaşdırma üçün avtonom fəaliyyət göstərməsinə etibar edə bilər, lakin onu maliyyə əməliyyatları üçün “təklif rejimində” saxlaya bilər. Biz bu səviyyələri avtonom avtomobillər üçün sənaye standartlarını (SAE səviyyələri) rəqəmsal istifadəçi təcrübəsi kontekstlərinə uyğunlaşdırmaqla əldə etdik. Müşahidə et və təklif et Agent monitor kimi fəaliyyət göstərir. O, məlumat axınlarını təhlil edir və anomaliyaları və ya fürsətləri qeyd edir, lakin sıfır tədbir görür. Fərqləndirmə Növbəti səviyyədən fərqli olaraq, agent heç bir mürəkkəb plan yaratmır. Problemə işarə edir. NümunəA DevOps agenti server CPU artımını görür və çağırış üzrə mühəndisə xəbərdarlıq edir. Onu necə düzəltməyə çalışacağını bilmir, amma nəyinsə səhv olduğunu bilir. Bu səviyyədə dizayn və nəzarət üçün təsirlər,dizayn və nəzarət aydın, müdaxilə etməyən bildirişlərə və istifadəçilərin təkliflər əsasında hərəkət etməsi üçün dəqiq müəyyən edilmiş prosesə üstünlük verməlidir. Diqqət, nəzarəti ələ keçirmədən istifadəçini vaxtında və müvafiq məlumatla təmin etməkdir. UX praktikləri diqqəti təklifləri aydın və asan başa düşülən etməyə yönəltməlidirlər, məhsul menecerləri isə sistemin istifadəçini sıxışdırmadan dəyər təmin etməsini təmin etməlidir. Planla və Təklif et Agent bir məqsədi müəyyənləşdirir və ona nail olmaq üçün çox addımlı strategiya yaradır. O, insan baxışının tam planını təqdim edir. Fərqləndirmə Agent strateq kimi çıxış edir. İcra etmir; bütün yanaşma üzrə təsdiq gözləyir. Nümunə Eyni DevOps agenti CPU artımını görür, qeydləri təhlil edir və düzəliş planı təklif edir:

İki əlavə nümunəni çevirin. Yük balanslaşdırıcısını yenidən başladın. Köhnə qeydləri arxivləşdirin.

İnsan məntiqi nəzərdən keçirir və "Planı təsdiq et" düyməsini klikləyir. Dizayn və nəzarət üçün nəticələr Planlaşdıran və təklif edən agentlər üçün dizayn təklif olunan planların asanlıqla başa düşülən olmasını və istifadəçilərin onları dəyişdirmək və ya rədd etmək üçün intuitiv yollara malik olmasını təmin etməlidir. Nəzarət təkliflərin keyfiyyətinə və agentin planlaşdırma məntiqinə nəzarət etmək üçün çox vacibdir. UX praktikləri təklif olunan planların aydın vizuallaşdırılmasını tərtib etməli və məhsul menecerləri aydın nəzərdən keçirmə və təsdiqləmə iş axınları yaratmalıdırlar. Təsdiqlə hərəkət edin Agent bütün hazırlıq işlərini tamamlayır və son hərəkəti mərhələli vəziyyətdə yerləşdirir. Qapını effektiv şəkildə açıq saxlayır, başını tərpətməyi gözləyir. Fərqləndirmə Bu, “Planla və Təklif et”dən fərqlənir, çünki iş artıq görülüb və səhnələşdirilib. Sürtünməni azaldır. İstifadəçi strategiyanı deyil, nəticəni təsdiqləyir. ExampleA işə götürmə agenti beş müsahibə dəvətnaməsi hazırlayır, təqvimlərdə açıq vaxtlar tapır və təqvim tədbirlərini yaradır. "Hamısını göndər" düyməsini təqdim edir. İstifadəçi xarici hərəkəti işə salmaq üçün son icazəni verir. Dizayn və nəzarət üçün təsirlər Agentlər təsdiqlə hərəkət etdikdə, dizayn potensial nəticələri aydın şəkildə əks etdirərək nəzərdə tutulan fəaliyyətin şəffaf və qısa xülasəsini təqdim etməlidir. Nəzarət təsdiqləmə prosesinin etibarlı olduğunu və istifadəçilərdən hərəkətləri kor-koranə təsdiqləmələrinin tələb olunmadığını yoxlamalıdır. UX praktikləri aydın və bütün lazımi məlumatları təmin edən təsdiq göstərişlərini tərtib etməlidirlər və məhsul menecerləri təsdiqlənmiş bütün hərəkətlər üçün güclü audit marşrutuna üstünlük verməlidirlər. Fəaliyyət - Muxtar Agent müəyyən edilmiş sərhədlər daxilində tapşırıqları müstəqil şəkildə yerinə yetirir. Fərqləndirmə İstifadəçi hərəkətlərin özlərini deyil, hərəkətlərin tarixini nəzərdən keçirir. Nümunə İşə götürən agent münaqişəni görür, müsahibəni ehtiyat nüsxəyə köçürür, namizədi yeniləyir və işə qəbul üzrə menecerə məlumat verir. İnsan yalnız bir bildiriş görür: Müsahibə çərşənbə axşamına təyin edildi. Dizayn və nəzarət üçün təsirlər Avtonom agentlər üçün dizayn əvvəlcədən təsdiq edilmiş aydın sərhədlər yaratmalı və güclü monitorinq alətlərini təmin etməlidir. Nəzarət bu sərhədlər daxilində agentin fəaliyyətinin davamlı olaraq qiymətləndirilməsini, istifadəçi nəzarətini və etibarını qorumaq üçün etibarlı giriş üçün kritik ehtiyacı, aydın ləğv mexanizmlərini və istifadəçi tərəfindən müəyyən edilmiş öldürmə açarlarını tələb edir. UX praktikləri diqqətini avtonom agent davranışına nəzarət etmək üçün effektiv idarə panellərinin dizaynına diqqət yetirməlidirlər və məhsul menecerləri aydın idarəetmə və etik qaydaların mövcud olmasını təmin etməlidirlər.

Bu rejimləri hərəkətdə görmək üçün HR texnologiyasındakı real dünya tətbiqinə baxaq. İşə qəbulun logistikasını idarə etmək üçün nəzərdə tutulmuş “Müsahibə Koordinasiya Agentini” nəzərdən keçirək.

Təklif Rejimində Agent müsahibə verənin ikiqat rezervasiya edildiyini görür. İşə götürənin idarə panelindəki münaqişəni vurğulayır: "Xəbərdarlıq: Sara saat 14:00-da müsahibə üçün iki dəfə sifariş olunub." Plan rejimində agent Saranın təqvimini və namizədin mövcudluğunu təhlil edir. O, həll yolunu təqdim edir: "Mən müsahibəni cümə axşamı səhər saat 10-a köçürməyi məsləhət görürəm. Bunun üçün Saranın meneceri ilə 1:1 hesabını dəyişmək lazımdır." İşəgötürən bu məntiqi nəzərdən keçirir. Təsdiqləmə rejimində agent namizədə və menecerə e-məktubları tərtib edir. Təqvim dəvətlərini doldurur. İşə götürən xülasə görür: "Cümə axşamına planlaşdırmağa hazırsınız. Yeniliklər göndərilsin?" İşə götürən "Təsdiq et" düyməsini klikləyir. Avtonom rejimdə agent münaqişəni dərhal idarə edir. O, əvvəlcədən müəyyən edilmiş qaydaya hörmət edir: “Həmişə namizəd müsahibələrini daxili 1:1-dən üstün tutun.” O, görüşü köçürür və bildirişlər göndərir. İşə götürən jurnal qeydini görür: “Həll olunduNamizəd B üçün münaqişə cədvəli.”

Tədqiqat Başçısı: Nə Tədqiq Etməli və Necə Effektiv agent AI-nin inkişafı ənənəvi proqram təminatı və ya hətta generativ AI ilə müqayisədə fərqli tədqiqat yanaşması tələb edir. Süni intellekt agentlərinin avtonom təbiəti, qərar qəbul etmək qabiliyyəti və fəal fəaliyyət potensialı istifadəçi gözləntilərini başa düşmək, mürəkkəb agent davranışlarını xəritələşdirmək və potensial uğursuzluqları gözləmək üçün xüsusi metodologiyaları tələb edir. Aşağıdakı tədqiqat primeri agent AI-nin bu unikal aspektlərini ölçmək və qiymətləndirmək üçün əsas metodları təsvir edir. Mental-Model Müsahibələr Bu müsahibələr istifadəçilərin süni intellekt agentinin necə davranması lazım olduğuna dair qərəzli təsəvvürlərini üzə çıxarır. Sadəcə olaraq istifadəçilərin nə istədiklərini soruşmaq əvəzinə, diqqət onların agentin imkanları və məhdudiyyətləri ilə bağlı daxili modellərini anlamaqdır. İştirakçılarla “agent” sözünü işlətməkdən çəkinməliyik. Bu, elmi-fantastik baqaj daşıyır və ya dəstək və ya xidmətlər təklif edən insan agenti ilə çox asanlıqla qarışdırılan bir termindir. Bunun əvəzinə müzakirəni “köməkçilər” və ya “sistem” ətrafında qurun. Biz istifadəçilərin faydalı avtomatlaşdırma və müdaxiləçi nəzarət arasında sərhədi harada çəkdiyini aşkar etməliyik.

Metod: İstifadəçilərdən müxtəlif hipotetik ssenarilərdə agentlə gözlənilən qarşılıqlı əlaqəni təsvir etmələrini, çəkmələrini və ya nəql etmələrini xahiş et. Əsas zondlar (müxtəlif sənaye sahələrini əks etdirir): İstədiyiniz avtomatlaşdırmanın sərhədlərini və həddindən artıq avtomatlaşdırma ilə bağlı potensial narahatlıqları anlamaq üçün soruşun: Uçuşunuz ləğv edilərsə, sistemin avtomatik olaraq nə etməsini istərdiniz? Sizin açıq göstərişiniz olmadan bunu etsəydi, sizi nə narahat edərdi?

İstifadəçinin agentin daxili prosesləri və zəruri ünsiyyəti haqqında anlayışını araşdırmaq üçün soruşun: Rəqəmsal köməkçinin ağıllı evinizi idarə etdiyini təsəvvür edin. Əgər bağlama çatdırılsa, onun hansı addımlar atacağını təsəvvür edirsiniz və hansı məlumatı alacağınızı gözləyirsiniz?

Çox mərhələli prosesdə nəzarət və razılıq ətrafında gözləntiləri aşkar etmək üçün soruşun: Rəqəmsal köməkçinizdən görüş təyin etməyi xahiş etsəniz, onun hansı addımlar atacağını düşünürsünüz? Hansı məqamlarda məsləhətləşmək və ya seçim etmək istərdiniz?

Metodun üstünlükləri: Gizli fərziyyələri ortaya qoyur, agentin planlaşdırılan davranışının istifadəçi gözləntilərindən fərqli ola biləcəyi sahələri vurğulayır və müvafiq nəzarət və əks əlaqə mexanizmlərinin dizaynını məlumatlandırır.

Agent Səyahət Xəritəçəkmə: Ənənəvi istifadəçi səyahətinin xəritələşdirilməsinə bənzər olaraq, agent səyahətinin xəritələşdirilməsi xüsusi olaraq istifadəçinin qarşılıqlı əlaqəsi ilə yanaşı, AI agentinin özünün gözlənilən hərəkətlərinə və qərar nöqtələrinə diqqət yetirir. Bu, potensial tələləri proaktiv şəkildə müəyyən etməyə kömək edir.

Metod: Bütün potensial hərəkətlər, qərarlar və xarici sistemlər və ya istifadəçilərlə qarşılıqlı əlaqələr də daxil olmaqla, agentin işinin başlanğıcından başa çatmasına qədər müxtəlif mərhələlərini əks etdirən vizual xəritə yaradın. Xəritə üçün əsas elementlər: Agent Fəaliyyətləri: Agent hansı xüsusi tapşırıqları və ya qərarları yerinə yetirir? İnformasiya Girişləri/Çıxışları: Agentə hansı məlumat lazımdır və o, hansı məlumatları yaradır və ya ötürür? Qərar Nöqtələri: Agent seçimləri harada edir və bu seçimlər üçün meyarlar hansılardır? İstifadəçinin qarşılıqlı əlaqə nöqtələri: İstifadəçi girişi harada təqdim edir, nəzərdən keçirir və ya hərəkətləri təsdiqləyir? Uğursuzluq Nöqtələri: Əsas odur ki, agentin təlimatları səhv şərh edə biləcəyi, yanlış qərar qəbul edə biləcəyi və ya yanlış təşkilatla qarşılıqlı əlaqədə ola biləcəyi xüsusi halları müəyyənləşdirin. Nümunələr: Yanlış alıcı (məsələn, həssas məlumatın yanlış şəxsə göndərilməsi), overdraft (məsələn, mövcud vəsaiti üstələyən avtomatlaşdırılmış ödəniş), niyyətin yanlış təfsiri (məsələn, birmənalı olmayan dilə görə səhv tarixə uçuş bron etmək).

Bərpa yolları: agent və ya istifadəçi bu uğursuzluqlardan necə qurtula bilər? Korreksiya və ya müdaxilə üçün hansı mexanizmlər mövcuddur?

Metodun üstünlükləri: Agentin əməliyyat axınının vahid görünüşünü təmin edir, gizli asılılıqları aşkar edir və mənfi nəticələrin qarşısını almaq və ya azaltmaq üçün təhlükəsizlik tədbirlərinin, səhvlərin idarə edilməsinin və istifadəçi müdaxiləsi nöqtələrinin proaktiv dizaynına imkan verir.

Simulyasiya edilmiş Səhv Davranış Testi: Bu yanaşma sistemi stress-test etmək və AI agenti uğursuz olduqda və ya gözləntilərdən yayındıqda istifadəçi reaksiyalarını müşahidə etmək üçün nəzərdə tutulmuşdur. Bu, mənfi vəziyyətlərdə etibarın bərpası və emosional cavabları başa düşməkdən ibarətdir.

Metod: Nəzarət edilən laboratoriya tədqiqatlarında agentin səhv etdiyi, əmri səhv şərh etdiyi və ya gözlənilmədən davrandığı ssenariləri qəsdən təqdim edin. Simulyasiya etmək üçün “səhv davranış” növləri: ƏmrSəhv şərh: Agent istifadəçinin nəzərdə tutduğundan bir qədər fərqli hərəkət edir (məsələn, bir əvəzinə iki məhsul sifariş etmək). Məlumatın Həddindən artıq yüklənməsi/Yükləməsi: Agent həddən artıq əhəmiyyətsiz məlumat verir və ya kifayət qədər kritik təfərrüat vermir. İstenmeyen Fəaliyyət: Agent istifadəçinin açıq şəkildə istəmədiyi və ya gözləmədiyi hərəkəti həyata keçirir (məsələn, təsdiq olmadan səhm almaq). Sistem xətası: Agent qəzaya uğrayır, cavab vermir və ya xəta mesajı verir. Etik dilemmalar: Agent etik nəticələri olan qərar qəbul edir (məsələn, gözlənilməz metrikaya əsaslanaraq bir vəzifəni digərindən üstün tutmaq).

Müşahidə Fokus: İstifadəçi Reaksiyaları: İstifadəçilər emosional olaraq necə reaksiya verirlər (məyusluq, qəzəb, çaşqınlıq, etibarın itirilməsi)? Bərpa cəhdləri: İstifadəçilər agentin davranışını düzəltmək və ya onun hərəkətlərini geri qaytarmaq üçün hansı addımları atır? Güvən Təmir Mexanizmləri: Sistemin daxili bərpası və ya əks əlaqə mexanizmləri etibarı bərpa etməyə kömək edirmi? İstifadəçilər səhvlər barədə necə məlumatlandırılmaq istəyirlər? Psixi Modelin dəyişməsi: Səhv davranış istifadəçinin agentin imkanları və ya məhdudiyyətləri haqqında anlayışını dəyişirmi?

Metodun üstünlükləri: Səhvlərin bərpası, rəy və istifadəçi nəzarəti ilə bağlı dizayn boşluqlarını müəyyən etmək üçün çox vacibdir. O, istifadəçilərin agent uğursuzluqlarına qarşı nə dərəcədə dayanıqlı olduqları və etimadı qorumaq və ya bərpa etmək üçün nəyin lazım olduğuna dair anlayışlar təqdim edir, daha möhkəm və bağışlayan agent sistemlərinə gətirib çıxarır.

Bu tədqiqat metodologiyalarını inteqrasiya etməklə, UX praktiki istifadəçiləri və onların süni intellekt agentləri arasında müsbət və məhsuldar əlaqələri gücləndirərək, onları etibarlı, idarə oluna bilən və hesabatlı etmək üçün agent sistemlərini istifadəyə yararlı etməkdən kənara çıxa bilər. Nəzərə alın ki, bunlar agent AI-ni effektiv şəkildə araşdırmaq üçün uyğun olan yeganə üsullar deyil. Bir çox başqa üsullar mövcuddur, lakin bunlar ən yaxın müddətdə praktikantlar üçün əlçatandır. Mən əvvəllər Oz Sehrbazı metodunu, konsepsiya testinin bir az daha təkmil metodunu əhatə etmişəm, bu da agent AI konsepsiyalarını araşdırmaq üçün dəyərli bir vasitədir. Tədqiqat Metodologiyasında Etik Mülahizələr Agentlik süni intellektini tədqiq edərkən, xüsusən də yanlış davranış və ya səhvləri təqlid edərkən, etik mülahizələri nəzərə almaq vacibdir. Etik UX tədqiqatına diqqət yetirən bir çox nəşrlər var, o cümlədən Smashing Magazine üçün yazdığım məqalə, UX Dizayn İnstitutundan bu təlimatlar və İnklüziv Dizayn Alətlər dəstindən bu səhifə. Agent AI üçün əsas ölçülər Agentlik süni intellekt sistemlərinin performansını və etibarlılığını effektiv qiymətləndirmək üçün sizə hərtərəfli əsas göstəricilər dəsti lazımdır. Bu ölçülər istifadəçi etibarı, sistem dəqiqliyi və ümumi istifadəçi təcrübəsi haqqında məlumat verir. Tərtibatçılar və dizaynerlər bu göstəriciləri izləməklə təkmilləşdirilməli sahələri müəyyən edə və AI agentlərinin təhlükəsiz və səmərəli işləməsini təmin edə bilərlər. 1. Müdaxilə dərəcəsi Avtonom agentlər üçün uğuru susmaqla ölçürük. Əgər agent tapşırığı yerinə yetirirsə və istifadəçi müəyyən edilmiş pəncərədə (məsələn, 24 saat) müdaxilə etmirsə və ya hərəkəti geri qaytarmırsa, biz bunu qəbul kimi hesab edirik. Müdaxilə dərəcəsini izləyirik: insan agenti dayandırmaq və ya düzəltmək üçün nə qədər tez-tez tullanır? Yüksək müdaxilə nisbəti etibar və ya məntiqdə yanlış uyğunlaşmaya işarə edir. 2. 1000 Tapşırıq üzrə Gözlənilməyən Hərəkətlərin Tezliyi Bu kritik metrik AI agenti tərəfindən istifadəçi tərəfindən arzu olunmayan və ya gözlənilməyən, hər 1000 tamamlanmış tapşırıq üçün normallaşdırılan hərəkətlərin sayını kəmiyyətləşdirir. Nəzərdə tutulmayan hərəkətlərin aşağı tezliyi istifadəçi niyyətini dəqiq şərh edən və müəyyən edilmiş sərhədlər daxilində işləyən yaxşı uyğunlaşdırılmış AI deməkdir. Bu metrik süni intellektin kontekst haqqında anlayışı, əmrləri ayırd etmək qabiliyyəti və təhlükəsizlik protokollarının möhkəmliyi ilə sıx bağlıdır. 3. Geri qaytarma və ya geri qaytarma dərəcələriBu metrik istifadəçilərin süni intellekt tərəfindən yerinə yetirilən hərəkəti nə qədər tez-tez geri qaytarmalı və ya geri qaytarmalı olduğunu izləyir. Yüksək geri qaytarma dərəcələri süni intellektin tez-tez səhvlər etdiyini, təlimatları səhv şərh etdiyini və ya istifadəçi gözləntilərinə uyğun olmayan şəkildə hərəkət etdiyini göstərir. Bu geri çəkilmələrin arxasında duran səbəblərin təhlili süni intellekt alqoritmlərini təkmilləşdirmək, istifadəçi seçimlərini başa düşmək və arzuolunan nəticələri proqnozlaşdırmaq qabiliyyəti üçün dəyərli rəy təmin edə bilər. Səbəbini anlamaq üçün geri qaytarma əməliyyatı ilə bağlı mikrosorğu həyata keçirməlisiniz. Məsələn, istifadəçi planlaşdırma dəyişikliyini geri çevirdikdə, sadə bir sorğu soruşa bilər: "Yanlış vaxt? Səhv insan? Yoxsa bunu sadəcə özünüz etmək istəyirsiniz?" İstifadəçiyə öz mülahizələrinə ən yaxşı uyğun gələn seçimi klikləməyə imkan verir. 4. Səhvdən sonra həll etmə vaxtıBu metrikistifadəçinin AI tərəfindən edilən səhvi düzəltməsi və ya AI sisteminin özünün səhv vəziyyətdən bərpası üçün lazım olan müddəti ölçür. Həll üçün qısa müddət istifadəçi məyusluğunu azalda və məhsuldarlığı saxlaya bilən səmərəli və istifadəçi dostu səhvlərin bərpası prosesini göstərir. Buraya xətanın müəyyən edilməsinin asanlığı, geri qaytarma və ya düzəliş mexanizmlərinin əlçatanlığı və AI tərəfindən verilən səhv mesajlarının aydınlığı daxildir.

Bu ölçüləri toplamaq Agent Fəaliyyət İD-lərini izləmək üçün sisteminizin alətlərini tələb edir. Cədvəl təklif etmək və ya uçuş sifariş etmək kimi agentin gördüyü hər bir fərqli hərəkət jurnallarda saxlanılan unikal ID yaratmalıdır. Müdaxilə dərəcəsini ölçmək üçün biz dərhal istifadəçi reaksiyasına baxmırıq. Müəyyən edilmiş pəncərədə əks hərəkətin olmamasını axtarırıq. Fəaliyyət ID-si səhər saat 9:00-da yaradılıbsa və heç bir insan istifadəçi həmin xüsusi ID-ni ertəsi gün səhər saat 9:00-a qədər dəyişdirmirsə və ya geri qaytarmırsa, sistem məntiqi olaraq onu Qəbul Edilib kimi işarələyir. Bu, aktiv təsdiqdən daha çox istifadəçinin səssizliyinə əsaslanaraq uğurun kəmiyyətini qiymətləndirməyə imkan verir. Geri Qaytarma Qiymətləri üçün xam saylar kifayət deyil, çünki kontekst yoxdur. Əsas səbəbi tutmaq üçün tətbiqinizin Geri Al və ya Geri qaytarma funksiyalarında kəsmə məntiqini tətbiq etməlisiniz. İstifadəçi agentin başlatdığı hərəkəti geri çevirdikdə, yüngül mikrosorğu işə salın. Bu, istifadəçidən səhvi faktiki olaraq yanlış, kontekstdən məhrum və ya tapşırığı əl ilə idarə etmək üçün sadə bir üstünlük kimi təsnif etməyi xahiş edən sadə üç seçimli modal ola bilər. Bu, kəmiyyət telemetriyasını keyfiyyət anlayışı ilə birləşdirir. Mühəndislik qruplarına pozulmuş alqoritm və istifadəçi seçim uyğunsuzluğunu ayırd etməyə imkan verir. Bu ölçülər ardıcıl olaraq izlənildikdə və hərtərəfli təhlil edildikdə, nəzarət, razılıq və hesabatlılıqda davamlı təkmilləşdirməyə imkan verən agent AI sistemlərinin performansını qiymətləndirmək üçün möhkəm çərçivə təmin edir. Aldanmaya Qarşı Dizayn Agentlər getdikcə daha bacarıqlı olduqca biz yeni risklə üzləşirik: Agent Sludge. Ənənəvi çamur abunəni ləğv etməyi və ya hesabı silməyi çətinləşdirən sürtünmə yaradır. Agentli çamur əks istiqamətdə hərəkət edir. O, nasazlığa qarşı sürtünməni aradan qaldıraraq, istifadəçinin öz maraqlarından çox biznesin xeyrinə olan bir hərəkətlə razılaşmağı asanlaşdırır. Səyahət sifarişinə kömək edən bir agenti nəzərdən keçirin. Aydın qoruyucu barmaqlıqlar olmadan sistem tərəfdaş aviaşirkətə və ya daha yüksək marjalı otelə üstünlük verə bilər. Bu seçimi optimal yol kimi təqdim edir. Sistemin səlahiyyətinə güvənən istifadəçi tövsiyəni yoxlamadan qəbul edir. Bu, sistemin rahatlıq adı altında gəlir üçün optimallaşdırdığı aldadıcı model yaradır. Yanlış Təsəvvür Edilən Yetkinlik Riski Aldatma pis niyyətdən qaynaqlana bilməz. O, tez-tez AI-də Təsəvvür edilən Yetkinlik kimi özünü göstərir. Böyük Dil Modelləri hətta səhv olduqda belə tez-tez nüfuzlu səslənir. Onlar təsdiqlənmiş faktla eyni inamla saxta bron təsdiqi və ya qeyri-dəqiq xülasə təqdim edirlər. İstifadəçilər təbii olaraq bu inamlı tona etibar edə bilərlər. Bu uyğunsuzluq sistem qabiliyyəti ilə istifadəçi gözləntiləri arasında təhlükəli boşluq yaradır. Biz bu boşluğu aradan qaldırmaq üçün xüsusi dizayn etməliyik. Əgər agent tapşırığı yerinə yetirə bilmirsə, interfeys bu uğursuzluğu aydın şəkildə bildirməlidir. Sistem əmin deyilsə, onu cilalanmış nəsrlə maskalamaqdansa, qeyri-müəyyənliyi ifadə etməlidir. Primitivlər vasitəsilə şəffaflıq Həm çamur, həm də halüsinasiyalar üçün antidot mənşəlidir. Hər bir avtonom fəaliyyət qərarın mənşəyini izah edən xüsusi metadata etiketini tələb edir. İstifadəçilər nəticənin arxasındakı məntiq zəncirini yoxlamaq qabiliyyətinə ehtiyac duyurlar. Buna nail olmaq üçün primitivləri praktik cavablara çevirməliyik. Proqram mühəndisliyində primitivlər agentin yerinə yetirdiyi məlumat və ya hərəkətlərin əsas vahidlərinə istinad edir. Mühəndis üçün bu API çağırışı və ya məntiq qapısı kimi görünür. İstifadəçiyə aydın izahat kimi görünməlidir. Dizayn problemi bu texniki addımları insanların oxuya biləcəyi əsaslandırmalara uyğunlaşdırmaqdan ibarətdir. Agent konkret uçuş tövsiyə edirsə, istifadəçi bunun səbəbini bilməlidir. İnterfeys ümumi təklifin arxasında gizlənə bilməz. O, əsas primitivi ifşa etməlidir: Məntiq: Ən Ucuz_Birbaşa_Uçuş və ya Məntiq: Partner_Airline_Priority. Şəkil 4 bu tərcümə axınını göstərir. Biz ibtidai xam sistemi - faktiki kod məntiqini götürürük və onu istifadəçiyə baxan sətirlə əlaqələndiririk. Məsələn, bir görüşün təqvim cədvəlini yoxlayan primitiv bir ifadə aydın ifadəyə çevrilir: Mən saat 16:00 təklif etdimgörüş. Bu şəffaflıq səviyyəsi agentin hərəkətlərinin məntiqli və faydalı görünməsini təmin edir. O, istifadəçiyə agentin onların maraqlarına uyğun hərəkət etdiyini yoxlamağa imkan verir. Primitivləri ifşa etməklə biz qara qutunu şüşə qutuya çevirərək istifadəçilərin öz rəqəmsal həyatlarında son səlahiyyət olaraq qalmasını təmin edirik.

Dizayn üçün səhnənin qurulması Agentlik sisteminin qurulması psixoloji və davranış anlayışının yeni səviyyəsini tələb edir. Bu, bizi adi istifadə testindən kənara çıxmağa və etibar, razılıq və hesabatlılıq sahəsinə keçməyə məcbur edir. Müzakirə etdiyimiz tədqiqat metodları, zehni modelləri araşdırmaqdan tutmuş, düzgün olmayan davranışı simulyasiya etməyə və yeni ölçüləri təyin etməyə qədər lazımi əsası təmin edir. Bu təcrübələr, avtonom sistemin harada uğursuz ola biləcəyini və daha da əhəmiyyətlisi, istifadəçi-agent münasibətlərini necə təmir edəcəyini qabaqcadan müəyyən etmək üçün əsas vasitələrdir. Agentlik AI-yə keçid istifadəçi-sistem əlaqəsinin yenidən tərifidir. Biz artıq sadəcə əmrlərə cavab verən alətlər üçün dizayn etmirik; adımızdan fəaliyyət göstərən tərəfdaşlar üçün dizayn edirik. Bu, dizayn imperativini səmərəlilik və istifadə rahatlığından şəffaflığa, proqnozlaşdırıla bilənliyə və nəzarətə dəyişir. Süni intellekt son klik olmadan uçuş sifariş edə və ya səhm alveri edə bildikdə, onun “on-rampalar” və “düşmə rampalarının” dizaynı böyük əhəmiyyət kəsb edir. İstifadəçilərin sükanı təhvil verdikdə belə, sürücünün oturacağında olduqlarını hiss etmələrini təmin etmək bizim məsuliyyətimizdir. Bu yeni reallıq həm də UX tədqiqatçısının rolunu artırır. Biz agentin muxtariyyətinin qoruyucularını müəyyən etmək və sınaqdan keçirmək üçün mühəndislər və məhsul menecerləri ilə əməkdaşlıq edərək istifadəçi etibarının qəyyumları oluruq. Tədqiqatçı olmaqdan əlavə, biz inkişaf prosesində istifadəçi nəzarəti, şəffaflıq və etik təminatların müdafiəçisi oluruq. Primitivləri praktiki suallara çevirməklə və ən pis vəziyyət ssenarilərini simulyasiya etməklə biz həm güclü, həm də təhlükəsiz olan möhkəm sistemlər qura bilərik. Bu məqalədə agent AI-nin tədqiqinin "nə" və "niyə" əsasları verilmişdir. Bu göstərdi ki, bizim ənənəvi alət dəstlərimiz yetərli deyil və biz yeni, perspektivli metodologiyaları qəbul etməliyik. Növbəti məqalə bu təməl üzərində qurulacaq, agentin faydasını istifadəçilər üçün şəffaf edən xüsusi dizayn nümunələri və təşkilati təcrübələri təqdim edərək, onların agent AI-nin gücündən inam və nəzarətlə istifadə edə bilməsini təmin edəcək. UX-in gələcəyi sistemləri etibarlı etməkdən ibarətdir. Agentlik süni intellekt haqqında əlavə məlumat əldə etmək üçün aşağıdakı resursları araşdıra bilərsiniz:

Agentic AI-də Google AI Blogu Microsoft-un AI agentləri ilə bağlı araşdırması

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free