在本系列的第一部分中,我们确立了从生成式人工智能到代理式人工智能的根本转变。我们探讨了为什么从建议到行动的飞跃需要用户体验研究人员、产品经理和领导者使用新的心理和方法论工具包。我们定义了代理行为的分类法,从建议到自主行动,概述了基本的研究方法,定义了代理污泥的风险,并建立了驾驭这一新领域所需的问责指标。我们介绍了内容和原因。 现在,我们从基础转向功能。本文提供了如何构建代理系统所必需的具体设计模式、操作框架和组织实践,这些系统不仅功能强大,而且透明、可控且值得用户信任。如果我们的研究是诊断工具,那么这些模式就是治疗计划。它们是实用的机制,通过它们我们可以给用户一种明显的控制感,即使我们赋予人工智能前所未有的自主权。目标是创造一种体验,让自主感觉像是用户授予的特权,而不是系统夺取的权利。 代理系统的核心用户体验模式 为代理人工智能设计就是为关系设计。这种关系与任何成功的伙伴关系一样,必须建立在明确的沟通、相互理解和既定界限的基础上。 为了管理从建议到行动的转变,我们利用遵循代理交互功能生命周期的六种模式:

行动前(建立意图)意图预览和自主拨号可确保用户在任何事情发生之前定义计划和代理的边界。 行动中(提供背景)可解释的理由和信心信号在代理工作时保持透明度,显示“为什么”和“确定性”。 行动后(安全和恢复)行动审核、撤消和升级路径为错误或高度模糊的时刻提供了安全网。

下面,我们将详细介绍每种模式,包括成功指标的建议。这些目标是基于行业标准的代表性基准;根据您的特定领域风险进行调整。 1. 意图预览:阐明内容和方式 这种模式相当于在对话中说:“这就是我要做的事情。你同意吗?”这是在用户代理关系中寻求同意的基本时刻。 在代理采取任何重大行动之前,用户必须对即将发生的事情有一个清晰、明确的了解。意向预览或计划摘要建立知情同意。这是行动前的对话停顿,将自主流程的黑匣子转变为透明的、可审查的计划。 心理基础在行动之前提出计划可以减少认知负担并消除意外,让用户有时间验证代理是否真正理解他们的意图。 有效意图预览的剖析:

清晰简洁预览必须能够立即被理解。它应该用通俗易懂的语言总结主要行动和结果,避免使用技术术语。例如,不应“执行对 cancel_booking(id: 4A7B) 的 API 调用”,而应声明“取消飞往旧金山的 AA123 航班”。 顺序步骤对于多步骤操作,预览应概述关键阶段。这揭示了代理的逻辑,并允许用户发现建议序列中的潜在问题。 清晰的用户操作预览是一个决策点,而不仅仅是一个通知。它必须伴随着一套明确的选择。这是一个故意产生摩擦的时刻,是过程中的一个“减速带”,旨在确保用户做出有意识的选择,特别是对于不可逆转或高风险的操作。

让我们回顾一下本系列第一部分中的旅行助手场景。我们使用这个主动助理来说明代理如何处理航班取消。代理发现航班取消并已制定恢复计划。 意图预览看起来像这样: 针对您的行程中断的建议计划我检测到您上午 10:05 的航班已被取消。我计划执行以下操作:取消 UA456 航班处理退款并确认取消详细信息。重新预订 DL789 航班预订下午 2:30 直达航班的已确认座位,因为这是下一趟可用的直达航班确认座位。更新酒店预订通知万豪酒店您将晚点抵达。通过电子邮件发送更新的行程将新的航班和酒店详细信息发送给您和您的助理 Jane Doe。[ 继续执行此计划 ] [ 编辑计划 ] [ 我自己处理 ]

这种预览是有效的,因为它提供了从取消到沟通的完整情况,并提供了三种不同的前进路径:完全同意(继续)、修改的愿望(编辑计划)或完全覆盖(我自己处理)。这种多方面的控制是信任的基石。

何时优先考虑此模式对于任何不可逆转的操作(例如删除用户数据)、涉及任何金额的金融交易、与其他人或系统共享信息或进行用户无法轻易撤消的重大更改,此模式都是不可协商的。 遗漏风险如果没有这一点,用户会感到被代理的行为伏击,并会禁用该功能以重新获得控制权。 成功的衡量标准:

接受率未经编辑而接受的计划/显示的总计划。目标> 85%。 覆盖频率总计 自己处理点击次数/显示的计划总数。比率 > 10% 会触发模型审查。 回忆准确度 预览隐藏 10 秒后,能够正确列出计划步骤的测试参与者的百分比。

将此应用于高风险领域 虽然旅行计划是一个相关的基线,但在复杂、高风险的环境中,这种模式变得不可或缺,在这种环境中,错误不仅会给个人旅行带来不便。我们许多人的工作环境中,错误的决定可能会导致系统中断、使患者的安全面临风险,或者不可靠的技术会带来许多其他灾难性后果。 考虑一个负责管理云基础设施的 DevOps 发布代理。在这种情况下,意图预览充当了防止意外停机的安全屏障。

在此界面中,具体术语(排空流量、回滚)取代了一般性术语,并且操作是二元且有影响力的。用户根据代理的逻辑授权重大操作转变,而不是批准建议。 2. 自治表盘:通过渐进授权校准信任 每一个健康的关系都有界限。 Autonomy Dial 是用户与代理建立联系的方式,定义他们对代理自行处理的内容感到满意。 信任不是一个二元开关;这是一个频谱。用户可能信任代理能够自主处理低风险任务,但要求对高风险决策进行完全确认。 Autonomy Dial 是一种渐进授权形式,允许用户设置他们喜欢的代理独立性级别,使他们成为定义关系的积极参与者。 心理基础允许用户调整代理的自主权,赋予他们控制点,让他们将系统的行为与他们的个人风险承受能力相匹配。 实现这可以作为应用程序中简单、清晰的设置来实现,最好是基于每个任务类型。使用我们第一篇文章中的分类法,设置可以是:

观察和建议我希望收到有关机会或问题的通知,但代理永远不会提出计划。 计划和建议代理可以创建计划,但我必须在采取任何行动之前审查每一项计划。 确认行动对于熟悉的任务,代理可以准备行动,我将给出最终的进行/不进行确认。 自主行动对于预先批准的任务(例如,50 美元以下的争议费用),代理可以独立行动并在事后通知我。

例如,电子邮件助理可以有一个单独的自主拨号盘,用于安排会议而不是代表用户发送电子邮件。这种粒度很关键,因为它反映了用户信任的微妙现实。 何时优先考虑此模式在任务风险和个人偏好差异很大的系统中(例如财务管理工具、通信平台)优先考虑此模式。它对于入职至关重要,允许用户从较低的自主权开始,并随着他们的信心增长而增加自主权。 遗漏风险如果没有这一点,遇到单一故障的用户将完全放弃代理,而不是简单地回拨其权限。 成功的衡量标准:

信任密度每个设置的用户百分比细分(例如,20% 建议、50% 确认、30% 自动)。 设置流失 每月设置更改的数量/活跃用户总数。高流失率表明信任挥发性。

3. 可解释的基本原理:回答为什么? 采取行动后,好的合作伙伴会解释他们的理由。这种模式是采取行动后的开放式沟通,回答“为什么”?在它被问之前。 “我这么做是因为你过去告诉过我你更喜欢 X。” 当代理行动时,尤其是自主行动时,用户脑海中最直接的问题通常是,它为什么这样做?可解释的基本原理模式主动回答了这个问题,为代理的决策提供了简洁的理由。这不是技术日志文件。在本系列的第一篇文章中,我们讨论了将系统原语转换为面向用户的语言以防止欺骗。该模式是该原则的实际应用。它将原始逻辑转换为基于用户自己陈述的偏好和先前输入的人类可读的解释。 心理基础当智能体的行为是可以解释的时,它们会让人感觉是合乎逻辑的而不是随机的,从而帮助用户建立智能体如何思考的准确心理模型。 有效的理由:

以先例为基础最好的解释可以追溯到规则、偏好或先前的行动。 简单直接避免复杂的条件逻辑。使用简单的“因为你说 X,所以我做了 Y”结构。

回到旅行示例,自动重新预订航班后,用户可能会在通知源中看到以下内容: 我已重新预订您取消的航班。新航班:达美 789,下午 2:30 起飞。我为何采取此操作:您原来的航班已被航空公司取消。您已预先批准自主重新预订当日直达航班。[ 查看新行程 ] [ 撤消此操作 ]

理由很明确、站得住脚,并且强化了代理在用户建立的边界内运行的想法。 何时优先考虑此模式对于任何从上下文中推理不能立即明显的自主操作,特别是对于在后台发生或由外部事件触发的操作(例如航班取消示例),应优先考虑该模式。 遗漏的风险如果没有这一点,用户会将有效的自主行为解释为随机行为或“错误”,从而阻止他们形成正确的心理模型。 成功的衡量标准:

为什么?票务量 每 1,000 名活跃用户中标记为“代理行为 - 不清楚”的支持票数。 理由验证在互动后微观调查中将解释评为“有帮助”的用户百分比。

4.信心信号 这种模式是关于主体在关系中的自我意识。通过传达自己的信心,它可以帮助用户决定何时信任其判断以及何时进行更多审查。 为了帮助用户校准自己的信任,代理应该表现出对其计划和行动的信心。这使得代理的内部状态更加清晰,并帮助用户决定何时更仔细地审查决策。 心理基础暴露不确定性有助于防止自动化偏差,鼓励用户仔细审查低信心计划而不是盲目接受它们。 实施:

置信度分数简单的百分比(例如置信度:95%)可以是一个快速、可扫描的指标。 范围声明明确声明代理的专业领域(例如范围:仅限旅行预订)有助于管理用户期望并防止他们要求代理执行不适合的任务。 视觉提示绿色复选标记可以表示高置信度,而黄色问号可以表示不确定,提示用户更仔细地查看。

何时优先考虑此模式当代理的性能可能因输入数据的质量或任务的模糊性而显着变化时,请优先考虑。它在专家系统(例如医疗辅助、代码助理)中尤其有价值,人类必须严格评估人工智能的输出。 遗漏的风险如果没有这一点,用户将成为自动化偏见的受害者,盲目地接受低可信度的幻觉,或者焦急地重复检查高可信度的工作。 成功的衡量标准:

校准分数模型置信度分数和用户接受率之间的皮尔逊相关性。目标> 0.8。 审查Delta低置信度计划和高置信度计划的平均审查时间之间的差异。预期为正(例如,+12 秒)。

5. 行动审计和撤消:终极安全网 信任需要知道你可以从错误中恢复过来。撤消功能是最终的关系安全网,向用户保证即使代理误解,后果也不会是灾难性的。 建立用户信心的最强大的机制是能够轻松逆转代理的操作。持久且易于阅读的操作审核日志,以及针对每个可能操作的显着“撤消”按钮,是最终的安全网。它极大地降低了授予自主权的感知风险。 心理基础知道错误很容易被纠正会产生心理安全感,鼓励用户委派任务而不必担心不可逆转的后果。 设计最佳实践:

时间线视图按时间顺序记录所有代理发起的操作的日志是最直观的格式。 清晰的状态指示器显示操作是否成功、正在进行或已撤消。 限时撤消对于在某个时间点后变得不可逆转的操作(例如,不可退款的预订),UI 必须明确传达此时间窗口(例如,可撤消 15 分钟)。这种关于系统局限性的透明度与撤消功能本身同样重要。诚实地对待一项行动何时成为永久性的可以建立信任。

何时优先考虑此模式这是一个基本模式,应该在几乎所有代理系统中实现。当引入自主功能或错误成本(财务、社会或数据相关)很高时,这是绝对没有商量余地的。 遗漏风险如果没有这一点,一个错误就会永久破坏信任,因为用户意识到他们没有安全网。 成功的衡量标准:

恢复率未完成的操作/执行的操作总数。如果特定任务的回复率 > 5%,则禁用该任务的自动化。 安全网转换成功使用撤消后 7 天内升级到“自主行动”的用户百分比。

6. 升级途径:优雅地处理不确定性 聪明的合作伙伴知道何时寻求帮助而不是猜测。这种模式允许代理通过升级给用户来优雅地处理歧义,表现出建立而不是削弱信任的谦逊态度。 即使是最先进的代理也会遇到不确定用户意图或最佳行动方案的情况。它如何处理这种不确定性是一个决定性的时刻。一个精心设计的智能体不会猜测;它升级了。 心理基础当代理承认其局限性而不是猜测时,它会通过在模棱两可的情况下尊重用户的权威来建立信任。 升级模式包括:

请求澄清“您提到‘下周二’。您是指 9 月 30 日还是 10 月 7 日?” 呈现选项“我找到了三个符合您条件的航班。哪一个最适合您?” 请求人工干预对于高风险或高度模糊的任务,代理应该有一个明确的途径来循环人类专家或支持代理。提示可能是:“这笔交易似乎不寻常,我对如何进行没有信心。您希望我将此标记为供人工审核吗?”

何时优先考虑此模式在用户意图可能不明确或高度依赖上下文的领域(例如,自然语言交互、复杂的数据查询)优先考虑。当代理在信息不完整的情况下运行或存在多个正确路径时,请使用此选项。 遗漏风险如果没有这一点,代理最终将做出自信的、灾难性的猜测,从而疏远用户。 成功的衡量标准:

升级频率代理请求帮助/总任务。健康范围:5-15%。 恢复成功率 升级后/总体升级完成的任务。目标> 90%。

图案 最适合 主要风险 关键指标 意图预览 不可逆转的或财务行为 用户感觉遭到伏击 >85% 录取率 自主拨号 具有可变风险级别的任务 完全放弃功能 设置流失率 可解释的理由 后台或自主任务 用户察觉到错误 “为什么?”门票量 信心信号 专家或高风险系统 自动化偏见 审查三角洲 操作审核和撤消 所有代理系统 永久失去信任 <5%回复率 升级途径 用户意图不明确 自信的、灾难性的猜测 >90% 恢复成功

表 1:Agentic AI UX 模式摘要。请记住根据您的特定领域风险和需求调整指标。 修复和补救设计 这是学习如何有效地道歉。一次好的道歉可以承认错误、修复损害,并承诺从中吸取教训。 错误是不可能的;它们是不可避免的。 代理系统的长期成功较少取决于其完美的能力,而更多地取决于其在失败时优雅恢复的能力。强大的修复和补救框架是核心特征,而不是事后的想法。 同情的道歉和明确的补救措施 当客服人员犯错时,错误信息就是道歉。它的设计必须符合心理精确度。这一刻是展现责任感的关键机会。从服务设计的角度来看,这就是公司可以利用服务恢复悖论的地方:经历过服务失败的客户,随后成功且富有同理心地恢复,实际上可以比从未经历过失败的客户变得更加忠诚。处理得当的错误可能比长期完美的执行更有力地建立信任。 关键是将错误视为需要修补的关系破裂。这涉及:

确认错误该消息应清楚、简单地说明发生了错误。例如:我错误地转账了资金。 说明立即纠正立即采取补救措施。示例:我已撤销该操作,资金已退回到您的帐户。 提供进一步帮助的途径始终提供与人工支持的明确链接。这减轻了挫败感,并表明除了代理人本身之外还有一个问责制度。

设计良好的修复 UI 可能如下所示: 我们在您最近的转会中犯了一个错误。我深表歉意。我将 250 美元转入错误的账户。✔ 纠正措施:转帐已撤销,您的 250 美元已退还。✔ 后续步骤:该事件已标记为内部审查,以防止再次发生。需要进一步帮助吗? [联系支持]

构建安全创新的治理引擎 上述设计模式是面向用户的控件,但如果没有强大的内部支持结构,它们就无法有效运行。这并不是要制造官僚障碍;而是要制造麻烦。这是关于建立战略优势。拥有成熟治理框架的组织可以以更快的速度和信心交付更雄心勃勃的代理功能,因为他们知道必要的护栏已经到位,可以降低品牌风险。该治理引擎将安全性从清单转变为有竞争力的资产。 该引擎应作为一个正式的治理机构,即代理人工智能道德委员会,由用户体验、产品和工程的跨职能联盟组成,并得到法律、合规和支持的重要支持。在较小的组织中,这些“委员会”角色通常会分解为产品、工程和设计领导的三位一体。 治理清单

法律/合规该团队是第一道防线,确保代理商的潜在行动保持在监管和法律范围内。它们帮助定义自主行动的禁区。 产品产品经理是代理商宗旨的管家。他们通过正式的自治政策来定义和监控其运营边界,该政策记录了代理可以做什么和不可以做什么。他们拥有代理风险登记册。 UX Research这个团队是用户信任和焦虑的代言人。他们负责运行信任校准研究、模拟不当行为测试和定性访谈的重复过程,以了解用户不断变化的代理心智模型。 工程该团队构建了信任的技术基础。他们必须构建具有强大日志记录、一键撤消功能以及生成清晰、可解释的基本原理所需的挂钩的系统。 支持这些团队处于失败的前线。他们必须接受培训并具备处理由代理错误引起的事件的能力,并且必须有一个向道德委员会的直接反馈循环,以报告现实世界的失败模式。

该治理结构应保持一组动态文档,包括主动识别潜在故障模式的代理风险登记册、定期审查的操作审核日志以及正式的自治政策文档。 从哪里开始:产品领导者的分阶段方法 对于产品经理和高管来说,集成代理人工智能感觉像是一项艰巨的任务。关键是不要将其视为一次发布,而是将其视为并行建立技术能力和用户信任的分阶段旅程。该路线图允许您的组织学习和适应,确保每一步都建立在坚实的基础上。 第一阶段:基础安全(建议和提议) 最初的目标是在不承担重大自主风险的情况下建立信任的基石。在这个阶段,代理人的权力仅限于分析和建议。

实现坚如磐石的意图预览:这是您的核心交互模型。让用户熟悉代理制定计划的想法,同时让用户完全控制执行。 构建操作审核和撤消基础设施:即使代理尚未自主行动,也可以构建用于记录和逆转的技术支架。这可以让您的系统为未来做好准备,并建立用户对安全网存在的信心。

第 2 阶段:校准自主权(确认后行动) 一旦用户对代理的建议感到满意,您就可以开始引入低风险的自主权。此阶段是教用户代理如何思考并让他们设定自己的节奏。

引入具有有限设置的 Autonomy Dial:首先允许用户授予客服人员“确认后行动”的权力。 部署可解释的基本原理:对于代理准备的每项操作,提供清晰的解释。这揭开了代理逻辑的神秘面纱,并强化了它是根据用户自己的偏好进行操作的。

第三阶段:主动授权(自主行动) 这是最后一步,只有在您从前面的阶段获得明确的数据证明用户信任系统后才采取。

对特定的预先批准的任务启用自主行动:使用第 2 阶段的数据(例如,高进行率、低撤消率)来识别第一组可以完全自动化的低风险任务。 监控和迭代:自主功能的推出并不是结束,而是监控性能、收集用户反馈并根据真实数据改进代理范围和行为的连续循环的开始。

设计为终极安全杠杆 代理人工智能的出现代表了人机交互的新领域。它预示着未来技术可以主动减轻我们的负担并简化我们的生活。但这种权力伴随着深刻的责任。 自主性是技术系统的输出,而可信性是设计过程的输出。我们的挑战是确保用户体验不是技术能力的牺牲品,而是技术能力的主要受益者。 作为用户体验专业人士、产品经理和领导者,我们的角色是充当这种信任的管理者。通过实施清晰的控制和同意设计模式、设计深思熟虑的修复路径以及构建强大的治理框架,我们创建了使代理人工智能可行的基本安全杠杆。我们不只是设计界面;我们正在构建关系。人工智能的实用性和接受度的未来取决于我们以智慧、远见和对用户最终权威的深刻尊重来设计这些复杂系统的能力。

You May Also Like

Enjoyed This Article?

Get weekly tips on growing your audience and monetizing your content — straight to your inbox.

No spam. Join 138,000+ creators. Unsubscribe anytime.

Create Your Free Bio Page

Join 138,000+ creators on Seemless.

Get Started Free