在本系列的第一部分中,我們確立了從生成式人工智慧到代理式人工智慧的根本轉變。我們探討了為什麼從建議到行動的飛躍需要使用者體驗研究人員、產品經理和領導者使用新的心理和方法論工具包。我們定義了代理行為的分類法,從建議到自主行動,概述了基本的研究方法,定義了代理污泥的風險,並建立了駕馭這一新領域所需的問責指標。我們介紹了內容和原因。 現在,我們從基礎轉向功能。本文提供如何建構代理系統所必需的具體設計模式、操作框架和組織實踐,這些系統不僅功能強大,而且透明、可控且值得使用者信任。如果我們的研究是診斷工具,那麼這些模式就是治療計畫。它們是實用的機制,透過它們我們可以給使用者一種明顯的控制感,即使我們賦予人工智慧前所未有的自主權。目標是創造一種體驗,讓自主感覺像是使用者授予的特權,而不是系統奪取的權利。 代理系統的核心使用者體驗模式 為代理人工智慧設計就是為關係設計。這種關係與任何成功的夥伴關係一樣,必須建立在明確的溝通、相互理解和既定界限的基礎上。 為了管理從建議到行動的轉變,我們利用遵循代理互動功能生命週期的六種模式:

行動前(建立意圖)意圖預覽和自主撥號可確保使用者在任何事情發生之前定義計劃和代理的邊界。 行動中(提供背景)可解釋的理由和信心訊號在代理工作時保持透明度,顯示「為什麼」和「確定性」。 行動後(安全和恢復)行動審核、撤消和升級路徑為錯誤或高度模糊的時刻提供了安全網。

下面,我們將詳細介紹每種模式,包括成功指標的建議。這些目標是基於行業標準的代表性基準;根據您的特定領域風險進行調整。 1. 意圖預覽:闡明內容和方式 這種模式相當於在對話中說:「這就是我要做的事情。你同意嗎?」這是在用戶代理關係中尋求同意的基本時刻。 在代理採取任何重大行動之前,使用者必須對即將發生的事情有一個清晰、明確的了解。意向預覽或計劃摘要建立知情同意。這是行動前的對話停頓,將自主流程的黑盒子轉變為透明的、可審查的計劃。 心理基礎在行動之前提出計劃可以減少認知負擔並消除意外,讓使用者有時間驗證代理是否真正理解他們的意圖。 有效意圖預覽的剖析:

清晰簡潔預覽必須能夠立即被理解。它應該用簡單易懂的語言總結主要行動和結果,避免使用技術術語。例如,不應“執行對 cancel_booking(id: 4A7B) 的 API 呼叫”,而應聲明“取消飛往舊金山的 AA123 航班”。 順序步驟對於多步驟操作,預覽應概述關鍵階段。這揭示了代理的邏輯,並允許用戶發現建議序列中的潛在問題。 清晰的使用者操作預覽是一個決策點,而不僅僅是一個通知。它必須伴隨著一套明確的選擇。這是一個故意產生摩擦的時刻,是過程中的一個“減速帶”,旨在確保用戶做出有意識的選擇,特別是對於不可逆轉或高風險的操作。

讓我們回顧一下本系列第一部分的旅行助手場景。我們使用這個主動助理來說明代理商如何處理航班取消。代理發現航班取消並已製定恢復計劃。 意圖預覽看起來像這樣: 針對您的行程中斷的建議計劃我偵測到您上午 10:05 的航班已被取消。我計劃執行以下操作:取消 UA456 航班處理退款並確認取消詳細資訊。重新預訂 DL789 航班預訂下午 2:30 直飛航班的已確認座位,因為這是下一趟可用的直飛航班確認座位。更新飯店預訂通知萬豪酒店您將晚點抵達。透過電子郵件發送更新的行程將新的航班和飯店詳細資訊發送給您和您的助理 Jane Doe。 [ 繼續執行此計劃 ] [ 編輯計劃 ] [ 我自己處理 ]

這種預覽是有效的,因為它提供了從取消到溝通的完整情況,並提供了三種不同的前進路徑:完全同意(繼續)、修改的願望(編輯計劃)或完全覆蓋(我自己處理)。這種多方面的控制是信任的基石。

何時優先考慮此模式對於任何不可逆轉的操作(例如刪除用戶資料)、涉及任何金額的金融交易、與其他人或系統共享資訊或進行用戶無法輕易撤消的重大更改,此模式都是不可協商的。 遺漏風險如果沒有這一點,使用者會感到被代理的行為伏擊,並會停用該功能以重新獲得控制權。 成功的衡量標準:

接受率未經編輯而接受的計劃/顯示的總計劃。目標> 85%。 覆蓋頻率總計 自行處理點擊次數/顯示的計畫總數。比率 > 10% 會觸發模型審查。 回憶準確度 預覽隱藏 10 秒後,能夠正確列出計畫步驟的測試參與者的百分比。

將此應用於高風險領域 雖然旅行計畫是一個相關的基線,但在複雜、高風險的環境中,這種模式變得不可或缺,在這種環境中,錯誤不僅會給個人旅行帶來不便。在我們許多人的工作環境中,錯誤的決定可能會導致系統中斷、使病患的安全面臨風險,或不可靠的技術會帶來許多其他災難性後果。 考慮一個負責管理雲端基礎架構的 DevOps 發布代理。在這種情況下,意圖預覽充當了防止意外停機的安全屏障。

在此介面中,具體術語(排空流量、回滾)取代了一般性術語,且操作是二元且有影響力的。使用者根據代理的邏輯授權重大操作轉變,而不是批准建議。 2. 自治錶盤:透過漸進授權校準信任 每一個健康的關係都有界線。 Autonomy Dial 是使用者與代理商建立聯繫的方式,定義他們對代理商自行處理的內容感到滿意。 信任不是一個二元開關;這是一個光譜。使用者可能信任代理人能夠自主處理低風險任務,但要求對高風險決策進行完全確認。 Autonomy Dial 是一種漸進式授權形式,允許使用者設定他們喜歡的代理獨立性級別,使他們成為定義關係的積極參與者。 心理基礎允許使用者調整代理的自主權,賦予他們控制點,讓他們將系統的行為與他們的個人風險承受能力相匹配。 實現這可以作為應用程式中簡單、清晰的設定來實現,最好是基於每個任務類型。使用我們第一篇文章中的分類法,設定可以是:

觀察和建議我希望收到有關機會或問題的通知,但代理商永遠不會提出計劃。 計劃和建議代理可以創建計劃,但我必須在採取任何行動之前審查每項計劃。 確認行動對於熟悉的任務,代理可以準備行動,我將給予最終的進行/不進行確認。 自主行動對於預先批准的任務(例如,50 美元以下的爭議費用),代理可以獨立行動並在事後通知我。

例如,電子郵件助理可以有一個單獨的自主撥號盤,用於安排會議而不是代表使用者發送電子郵件。這種粒度很關鍵,因為它反映了用戶信任的微妙現實。 何時優先考慮此模式在任務風險和個人偏好差異很大的系統中(例如財務管理工具、通訊平台)優先考慮此模式。它對於入職至關重要,允許用戶從較低的自主權開始,並隨著他們的信心增長而增加自主權。 遺漏風險如果沒有這一點,遇到單一故障的用戶將完全放棄代理,而不是簡單地回撥其權限。 成功的衡量標準:

信任密度每個設定的使用者百分比細分(例如,20% 建議、50% 確認、30% 自動)。 設定流失 每月設定更改的數量/活躍用戶總數。高流失率表示信任揮發性。

3. 可解釋的基本原理:回答為什麼? 採取行動後,好的合作夥伴會解釋他們的理由。這種模式是採取行動後的開放式溝通,回答「為什麼」?在它被問到之前。 “我這麼做是因為你過去告訴我你更喜歡 X。” 當代理行動時,尤其是自主行動時,使用者腦海中最直接的問題通常是,為什麼它會這樣做?可解釋的基本原理模式主動回答了這個問題,為代理的決策提供了簡潔的理由。這不是技術日誌檔。在本系列的第一篇文章中,我們討論了將系統原語轉換為使用者導向的語言以防止欺騙。該模式是該原則的實際應用。它將原始邏輯轉換為基於使用者自己陳述的偏好和先前輸入的人類可讀的解釋。 心理基礎當智能體的行為是可以解釋的時,它們會讓人感覺是合乎邏輯的而不是隨機的,從而幫助使用者建立智能體如何思考的準確心理模型。 有效的理由:

以先例為基礎最好的解釋可以追溯到規則、偏好或先前的行動。 簡單直接避免複雜的條件邏輯。使用簡單的“因為你說 X,所以我做了 Y”結構。

回到旅行範例,自動重新預訂航班後,用戶可能會在通知來源中看到以下內容: 我已重新預訂您取消的航班。新航班:達美 789,下午 2:30 起飛。我為何採取此操作:您原來的航班已被航空公司取消。您已預先核准自主重新預訂當日直飛航班。 [ 查看新行程 ] [ 撤銷此操作 ]

理由很明確、站得住腳,並且強化了代理人在使用者建立的邊界內運作的想法。 何時優先考慮此模式對於任何從上下文中推理不能立即明顯的自主操作,特別是對於在後台發生或由外部事件觸發的操作(例如航班取消示例),應優先考慮該模式。 遺漏的風險如果沒有這一點,使用者會將有效的自主行為解釋為隨機行為或“錯誤”,從而阻止他們形成正確的心理模型。 成功的衡量標準:

為什麼?票務量 每 1,000 名活躍用戶中標記為「代理行為 - 不清楚」的支援票數。 理由驗證在互動後微觀調查中將解釋評為「有幫助」的使用者百分比。

4.信心訊號 這種模式是關於主體在關係中的自我意識。透過傳達自己的信心,它可以幫助用戶決定何時信任其判斷以及何時進行更多審查。 為了幫助用戶校準自己的信任,代理商應該表現出對其計劃和行動的信心。這使得代理的內部狀態更加清晰,並幫助使用者決定何時更仔細地審查決策。 心理基礎暴露不確定性有助於防止自動化偏差,鼓勵使用者仔細審查低信心計劃而不是盲目接受它們。 實施:

置信度分數簡單的百分比(例如置信度:95%)可以是一個快速、可掃描的指標。 範圍聲明明確聲明代理的專業領域(例如範圍:僅限旅行預訂)有助於管理用戶期望並防止他們要求代理執行不適合的任務。 視覺提示綠色複選標記可以表示高置信度,而黃色問號可以表示不確定,提示使用者更仔細地查看。

何時優先考慮此模式當代理程式的效能可能因輸入資料的品質或任務的模糊性而顯著變化時,請優先考慮。它在專家系統(例如醫療輔助、代碼助理)中尤其有價值,人類必須嚴格評估人工智慧的輸出。 遺漏的風險如果沒有這一點,使用者將成為自動化偏見的受害者,盲目地接受低可信度的幻覺,或焦慮地重複檢查高可信度的工作。 成功的衡量標準:

校準分數模型置信度分數和使用者接受率之間的皮爾森相關性。目標> 0.8。 檢視Delta低置信度計劃和高置信度計劃的平均審查時間之間的差異。預期為正(例如,+12 秒)。

5. 行動審計與撤銷:終極安全網 信任需要知道你可以從錯誤中恢復過來。撤銷功能是最終的關係安全網,向使用者保證即使代理誤解,後果也不會是災難性的。 建立用戶信心的最強大的機制是能夠輕鬆逆轉代理的操作。持久且易於閱讀的操作審核日誌,以及針對每個可能操作的顯著「撤消」按鈕,是最終​​的安全網。它極大地降低了授予自主權的感知風險。 心理基礎知道錯誤很容易被糾正會產生心理安全感,鼓勵使用者委派任務而不必擔心不可逆轉的後果。 設計最佳實務:

時間軸視圖按時間順序記錄所有代理程式發起的操作的日誌是最直觀的格式。 清晰的狀態指示器顯示操作是否成功、正在進行或已撤銷。 限時撤銷對於在某個時間點後變得不可逆轉的操作(例如,不可退款的預訂),UI 必須明確傳達此時間窗口(例如,可撤銷 15 分鐘)。這種關於系統限制的透明度與撤銷功能本身同樣重要。誠實地對待一項行動何時成為永久性的可以建立信任。

何時優先考慮此模式這是一個基本模式,應該在幾乎所有代理系統中實現。當引入自主功能或錯誤成本(財務、社會或數據相關)很高時,這是絕對沒有商量餘地的。 遺漏風險如果沒有這一點,一個錯誤就會永久破壞信任,因為使用者意識到他們沒有安全網。 成功的衡量標準:

恢復率未完成的操作/執行的操作總數。如果特定任務的回覆率 > 5%,則會停用該任務的自動化。 安全網轉換成功使用撤銷後 7 天內升級到「自主行動」的使用者百分比。

6. 升級途徑:優雅地處理不確定性 聰明的合作夥伴知道何時尋求幫助而不是猜測。這種模式允許代理透過升級給使用者來優雅地處理歧義,表現出建立而不是削弱信任的謙遜態度。 即使是最先進的代理商也會遇到不確定使用者意圖或最佳行動方案的情況。它如何處理這種不確定性是一個決定性的時刻。一個精心設計的智能體不會猜測;它升級了。 心理基礎當代理人承認其限製而不是猜測時,它會透過在模糊的情況下尊重使用者的權威來建立信任。 升級模式包括:

請求澄清“您提到‘下週二’。您是指 9 月 30 日還是 10 月 7 日?” 呈現選項“我找到了三個符合您條件的航班。哪一個最適合您?” 請求人工幹預對於高風險或高度模糊的任務,代理應該有一個明確的途徑來循環人類專家或支持代理。提示可能是:“這筆交易似乎不尋常,我對如何進行沒有信心。您希望我將此標記為供人工審核嗎?”

何時優先考慮此模式在使用者意圖可能不明確或高度依賴上下文的領域(例如,自然語言互動、複雜的資料查詢)優先考慮。當代理程式在資訊不完整的情況下運行或存在多個正確路徑時,請使用此選項。 遺漏風險如果沒有這一點,代理最終將做出自信的、災難性的猜測,從而疏遠用戶。 成功的衡量標準:

升級頻率代理請求幫助/總任務。健康範圍:5-15%。 恢復成功率 升級後/整體升級完成的任務。目標> 90%。

圖案 最適合 主要風險 關鍵指標 意圖預覽 不可逆轉的或財務行為 用戶感覺遭到伏擊 >85% 錄取率 自主撥號 具有可變風險等級的任務 完全放棄功能 設定流失率 可解釋的理由 後台或自主任務 使用者察覺到錯誤 「為什麼?」門票量 信心訊號 專家或高風險系統 自動化偏見 檢討三角洲 操作審核和撤銷 所有代理系統 永久失去信任 <5%回覆率 升級途徑 用戶意圖不明確 自信的、災難性的猜測 >90% 恢復成功

表 1:Agentic AI UX 模式摘要。請記住根據您的特定領域風險和需求調整指標。 修復和補救設計 這是學習如何有效地道歉。一次好的道歉可以承認錯誤、修復損害,並承諾從中學習。 錯誤是不可能的;它們是不可避免的。 代理系統的長期成功較少取決於其完美的能力,而更多地取決於其在失敗時優雅恢復的能力。強大的修復和補救框架是核心特徵,而不是事後的想法。 同情的道歉和明確的補救措施 當客服人員犯錯時,錯誤訊息就是道歉。它的設計必須符合心理精確度。這一刻是展現責任感的關鍵機會。從服務設計的角度來看,這就是公司可以利用服務恢復悖論的地方:經歷過服務失敗的客戶,隨後成功且富有同理心地恢復,實際上可以比從未經歷過失敗的客戶變得更加忠誠。處理得當的錯誤可能比長期完美的執行更有力地建立信任。 關鍵是將錯誤視為需要修補的關係破裂。這涉及:

確認錯誤該訊息應清楚、簡單地說明發生了錯誤。例如:我錯誤地轉帳了資金。 說明立即糾正立即採取補救措施。範例:我已撤銷該操作,資金已退回到您的帳戶。 提供進一步幫助的途徑始終提供與人工支援的明確連結。這減輕了挫敗感,並表明除了代理人本身之外還有一個問責制度。

設計良好的修復 UI 可能如下所示: 我們在您最近的轉會中犯了一個錯誤。我深表歉意。我將 250 美元轉入錯誤的帳戶。 ✔ 糾正措施:轉帳已撤銷,您的 250 美元已退還。 ✔ 後續步驟:此事件已標示為內部審查,以防止再次發生。需要進一步幫助嗎? [聯絡支援]

建構安全創新的治理引擎 上述設計模式是面向使用者的控件,但如果沒有強大的內部支援結構,它們就無法有效運作。這不是要製造官僚障礙;而是要製造麻煩。這是關於建立策略優勢。擁有成熟治理框架的組織可以以更快的速度和信心交付更雄心勃勃的代理功能,因為他們知道必要的護欄已經到位,可以降低品牌風險。該治理引擎將安全性從清單轉變為有競爭力的資產。 該引擎應作為一個正式的治理機構,即代理人工智慧道德委員會,由使用者體驗、產品和工程的跨職能聯盟組成,並得到法律、合規和支持的重要支持。在較小的組織中,這些「委員會」角色通常會分解為產品、工程和設計領導的三位一體。 治理清單

法律/合規該團隊是第一道防線,確保代理商的潛在行動保持在監管和法律範圍內。它們幫助定義自主行動的禁區。 產品產品經理是代理商宗旨的管家。他們透過正式的自治政策來定義和監控其營運邊界,該政策記錄了代理可以做什麼和不可以做什麼。他們擁有代理風險登記冊。 UX Research這個團隊是使用者信任和焦慮的代言人。他們負責執行信任校準研究、模擬不當行為測試和定性訪談的重複過程,以了解使用者不斷變化的代理心智模型。 工程該團隊建構了信任的技術基礎。他們必須建立具有強大日誌記錄、一鍵撤消功能以及產生清晰、可解釋的基本原理所需的掛鉤的系統。 支援這些團隊處於失敗的前線。他們必須接受培訓並具備處理由代理錯誤引起的事件的能力,並且必須有一個向道德委員會的直接反饋循環,以報告現實世界的失敗模式。

此治理結構應維持一組動態文檔,包括主動識別潛在故障模式的代理風險登記冊、定期審查的操作審核日誌以及正式的自治政策文檔。 從哪裡開始:產品領導者的分階段方法 對於產品經理和高階主管來說,整合代理人工智慧感覺像是一項艱鉅的任務。關鍵是不要將其視為一次發布,而是將其視為並行建立技術能力和用戶信任的分階段旅程。這張路線圖可讓您的組織學習和適應,確保每一步都建立在堅實的基礎上。 第一階段:基礎安全(建議與提議) 最初的目標是在不承擔重大自主風險的情況下建立信任的基石。在這個階段,代理人的權力僅限於分析和建議。

實現堅如磐石的意圖預覽:這是您的核心互動模型。讓使用者熟悉代理制定計劃的想法,同時讓使用者完全控制執行。 建構操作審核和撤消基礎設施:即使代理尚未自主行動,也可以建造用於記錄和逆轉的技術支架。這可以讓您的系統為未來做好準備,並建立用戶對安全網存在的信心。

第 2 階段:校準自主權(確認後行動) 一旦使用者對代理商的建議感到滿意,您就可以開始引入低風險的自主權。此階段是教導用戶代理如何思考並讓他們設定自己的步調。

引入具有有限設定的 Autonomy Dial:首先允許使用者授予客服人員「確認後行動」的權力。 部署可解釋的基本原理:對於代理程式準備的每項操作,提供清晰的解釋。這揭開了代理邏輯的神秘面紗,並強化了它是根據使用者自己的偏好進行操作的。

第三階段:主動授權(自主行動) 這是最後一步,只有在您從前面的階段獲得明確的數據證明用戶信任系統後才採取。

對特定的預先批准的任務啟用自主行動:使用第 2 階段的資料(例如,高進行率、低撤銷率)來識別第一組可以完全自動化的低風險任務。 監控和迭代:自主功能的推出並不是結束,而是監控效能、收集使用者回饋並根據真實資料改進代理範圍和行為的連續循環的開始。

設計為終極安全槓桿 代理人工智慧的出現代表了人機互動的新領域。它預示著未來科技可以主動減輕我們的負擔並簡化我們的生活。但這種權力伴隨著深刻的責任。 自主性是技術系統的輸出,而可信性是設計過程的輸出。我們的挑戰是確保使用者體驗不是技術能力的犧牲品,而是技術能力的主要受益者。 作為使用者體驗專業人士、產品經理和領導者,我們的角色是扮演這種信任的管理者。透過實施清晰的控制和同意設計模式、設計深思熟慮的修復路徑以及建立強大的治理框架,我們創建了使代理人工智慧可行的基本安全槓桿。我們不只是設計介面;我們正在建立關係。人工智慧的實用性和接受度的未來取決於我們以智慧、遠見和對使用者最終權威的深刻尊重來設計這些複雜系統的能力。

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free