OpenAI董事会主席Bret Taylor的Agent公司Sierra:专注于赋能下一代企业用户体验

时间:2024-10-08 08:12:50

本文由readlecture.cn转录总结。ReadLecture专注于音、视频转录与总结,2小时视频,5分钟阅读,加速内容学习与传播。

视频来源

youtube: https://www.youtube.com/watch?v=riWB5nPNZEM&t=47s

大纲

  • 介绍

    • 欢迎与介绍

      • 介绍Bret Taylor,一位技术专家,职业生涯跨越Google Maps到Salesforce。

      • 介绍Elad Gil,一位长期的朋友加入对话。

    • 讨论目的

      • 探讨“Agent”概念及其当前和未来的应用。

  • Agent的定义与分类

    • 学术与行业定义

      • 学术定义:能够推理和自主行动的软件。

      • 行业用法:差异很大,通常依赖于上下文。

    • Agent的分类

      • 个人Agent

        • 能力:处理收件箱、安排假期、准备会议。

        • 挑战:人机交互的复杂性和系统集成。

      • 角色Agent

        • 能力:执行特定任务,如法律功能或编码任务。

        • 优势:专注带来更有效的解决方案。

      • 公司Agent

        • 目的:在对话式AI中代表公司。

        • 应用:客户互动、商业、客户服务。

  • 公司Agent的开发与挑战

    • 开发周期

      • 研究与现实之间的差距。

      • 投资于理解客户环境。

    • 主要挑战

      • 利用基础模型。

      • 与专有业务数据集成。

      • 平衡创造力与约束。

  • 市场与商业模式

    • 市场动态

      • 可能围绕云提供商和主要研究实验室的整合。

      • 工具和解决方案公司的重要性。

    • 商业模式

      • 基于成果的定价。

      • 使商业模式与客户成果对齐。

  • 应用领域与影响

    • 当前应用领域

      • 编码、客户成功、销售生产力。

    • 未来应用领域

      • 自动化分析师角色。

      • 增强后台分析。

  • 客户体验与管理

    • 管理客户体验

      • 正式化和定义流程。

      • 赋能客户体验团队。

    • 涌现行为

      • 处理长尾客户体验。

      • 个性化品牌体验。

  • 技术趋势与未来方向

    • 对形式因素的影响

      • 智能手机主导地位的潜在转变。

      • 对话式AI在减少屏幕时间中的作用。

    • 人机交互

      • 交互模式的演变。

      • AI Agent代表用户处理更多任务的潜力。

  • 结论

    • 关键点总结

      • AI Agent在各个领域的重要性。

      • AI退居幕后,实现更无缝人机交互的潜力。

总结

一句话总结

Bret Taylor 讨论了 AI Agent的演变和未来,强调了它们彻底改变客户体验和重新定义人机交互的潜力。

要点

  1. 个人Agent:早期且令人兴奋,能够管理个人任务,但由于复杂的人机交互而具有挑战性。

  2. 角色Agent:已经存在于法律和编码等特定角色中,通过缩小关注点提供更有效的解决方案。

  3. 公司Agent:通过对话式 AI 专注于数字存在,类似于 1995 年拥有一个网站。

  4. 基础模型:AI 进步的关键,少数主要参与者可能会主导预训练。

  5. 基于结果的定价:一种强大的新型商业模式,使 AI 公司与客户成果保持一致。

  6. 交互转变:AI 有可能退居幕后,允许在物理世界中更多地存在。

深入问答

  1. Agent的三个类别是什么?

    • 个人Agent、角色Agent和公司Agent。

  2. 基础模型如何影响 AI 市场?

    • 它们推动了显著的进步,但可能会被少数主要参与者主导。

  3. 基于结果的定价在 AI 中的重要性是什么?

    • 它使 AI 公司与客户成果保持一致,使交付的价值可衡量且有影响力。

  4. AI Agent如何改变客户服务?

    • 它们通过提供即时解决方案来降低成本并提高客户满意度。

  5. 人机交互的未来是什么?

    • 可能会从以屏幕为中心的交互转向更多对话式和背景集成的体验。

关键词标签

  • AI Agent

  • 客户体验

  • 基础模型

  • 基于结果的定价

  • 人机交互

目标受众

  • 科技创业者:对 AI 的最新趋势和机会感兴趣。

  • 企业领导者:希望了解 AI 如何增强客户体验和运营效率。

  • AI 研究人员:寻找 AI 实际应用和未来方向的见解。

  • 投资者:对 AI 初创企业和创新的潜力感兴趣。

  • 消费者:好奇 AI 将如何影响日常生活和与技术的互动。

术语解释

  • 个人Agent:设计用于管理个人任务和交互的 AI 系统。

  • 角色Agent:为特定角色或任务量身定制的 AI 系统,如法律或编码功能。

  • 公司Agent:代表公司数字存在的 AI 系统,处理客户交互。

  • 基础模型:作为各种 AI 应用基础的大型预训练模型。

  • 基于结果的定价:一种商业模式,定价与为客户实现的衡量结果挂钩。

讲座回顾

  • 布雷特·泰勒的职业经历包括在谷歌、脸书、Salesforce和Twitter担任职务。

  • 他创立了两家公司,并担任OpenAI的董事会主席。

  • 泰勒和克莱·博尔正在创建Sierra,专注于下一代客户体验。

Sarah Guo: 嗨,听众们,欢迎回到《No Priors》。今天,我们有幸邀请到布雷特·泰勒,他的传奇职业生涯横跨创建谷歌地图、担任Facebook首席技术官和Salesforce首席执行官。在此过程中,他创立了两家公司,并担任Twitter和现在OpenAI的董事会主席。他与克莱·博尔共同创办了Sierra,该公司正在为下一代客户体验打造公司Agent。我非常激动能邀请到这样一位杰出的技术专家和领导者来到我们的节目。

  • 对话以欢迎和开始讨论Agent的提示开始。

  • Agent的定义并未立即提供,表明可能会有后续讨论。

Bret Taylor: Elad Gil今天加入了我们,他是一位老朋友。欢迎,Bret。非常感谢你今天加入我们。

Sarah Guo: 谢谢邀请我。我们直接开始吧。

Bret Taylor: 嗯,今天有Agent工作吗?你是如何定义Agent的,还是你想让我...?

Sarah Guo: 定义Agent,你定义Agent,你就是

  • “专家Agent”一词在学术界和行业中的含义有所不同。

  • 学术定义:Agent系统是能够进行推理和自主行动的软件。

  • 行业应用:差异很大,通常受特定应用的影响。

  • 三种即将可行的Agent类别:

    1. 个人Agent:协助处理邮件分类、日程安排和日历管理等任务。

    2. 角色Agent:执行特定工作,如法律或编码任务。

Bret Taylor: “专家Agent”这一术语在学术界和工业界有着不同的含义。两种定义都很重要,但经典的学术定义认为,Agent系统是一种能够进行推理并采取自主行动的软件,源于“Agent”这一概念。这种宽泛的学术定义可以被视为一种墨迹测试,用以考察该术语在工业界的应用情况。

有三类Agent正处于成为可行的边缘。第一类,个人Agent,可能是最早也是最令人兴奋的。这些Agent可以处理你的收件箱、安排假期、为会议做准备以及管理你的日程。虽然已有一些有趣的演示,但人机交互和系统集成的复杂性使得这一领域充满挑战。推理和系统集成的范围几乎无限,这意味着创建一个优秀的个人Agent可能需要比目前更先进的技术。然而,许多初创公司正在探索这一领域,随着技术的进步,我们可以期待出现有意义的细分应用场景。

第二类,基于角色的Agent,已经以某些形式存在。这些Agent执行非常具体的任务,例如法律功能(例如,Harvey)或编程任务(例如,编程Agent)。这令人兴奋,因为缩小关注范围可以带来更有效的解决方案,尤其是在计算机编程等角色中。

Sarah Guo: 如果你只是试图平衡任务范围和用户集成范围。

  • 基础模型的出现将AI研究转变为工程。

  • 可以为法律和软件工程等特定领域设计有效的AI Agent。

  • 个人Agent可能主要由大型消费公司主导。

  • 公司Agent通过对话式AI专注于数字存在。

  • 当前技术使公司Agent“即插即用”,便于实施。

  • 挑战在于围绕品牌定义对话体验。

  • 人工通用智能(AGI)提出了不同的问题。

Bret Taylor: 没错。你使用的工具,甚至你评估它们有效性的方式——如果你在构建一个编码Agent,已经有一些非常好的基准测试了。同样,编译器和集成测试构建了一个脚手架,实际上限制了为达成目标所需进行的真正研究的范围。

我认为广义上讲,随着基础模型的兴起,很多有效的AI现在涉及将研究领域转变为工程领域。我相信你可以在某些适用技术的领域,如法律、软件工程等,设计出非常有效的基于角色的Agent。

我的看法是,个人Agent领域可能由像苹果、谷歌、OpenAI等拥有大型消费品牌的公司主导。我认为在每个这些领域都可能存在有意义的企业,因为有效地做到这一点需要AI专业知识和该领域专业知识的结合。

另一个类别,也就是我的公司SI所从事的领域,我称之为公司Agent。这其实更少关乎自动化或自主性,而是关于你的公司在对话AI的世界中如何数字化存在。我总是用这样的比喻,如果是在1995年,数字化存在意味着拥有一个网站并出现在雅虎目录中。而在2025年,数字化存在可能意味着拥有一个品牌化的AI Agent,你的客户可以通过它与你的网站进行所有互动——无论是询问你的产品和服务、进行交易,还是处理客户服务。

我认为这个领域现在已经是 shovel-ready(随时可挖掘)的状态,因为就像基于角色的Agent一样,技术上并不需要煮沸所谓的海洋。你已经有明确定义的客户体验流程和作为记录系统的明确定义的系统。这实际上是在说,在这个从网站到应用再到对话体验的世界里,你希望围绕你的品牌构建什么样的对话体验?这并不意味着它是完美或容易的,否则我们也不会围绕它成立一家公司,但至少它是明确定义的。

我认为目前在AI领域,如果你在研究通用人工智能,你眼中的Agent可能意味着不同的东西,这没问题——这只是需要解决的另一个问题。但我认为,特别是在Sierra所从事的领域以及你们投资的许多公司中,这只是说,现在是否存在一些利用现有技术的 shovel-ready(随时可挖掘)的机会?我绝对认为存在。

  • 构建公司Agent的开发周期涉及弥合研究与现实之间的差距。

  • 工程团队需要投入精力理解不同客户环境的范围。

Sarah Guo: 描述构建公司Agent的发展周期。 研究与现实之间的差距是什么?作为工程团队,你们如何投资于理解不同客户环境的范围?

  • Sierra当前提供的产品定义。

  • Sierra未来产品供应的愿景。

  • 讨论Sierra成为其行业领导者的潜力。

  • 理解Sierra愿景对更广泛受众的重要性。

Bret Taylor: 这里的投资方向。

Elad Gil: 或许作为起点,首先定义一下Sierra目前为客户提供的产品以及您对其未来发展的设想是值得的。 然后,我们可以讨论这一愿景的组成部分,因为我认为Sierra正在成为您所在领域的领导者。然而,对于更广泛的受众来说,理解这一点也是有好处的。

  • Sonos使用由Sierra驱动的AI进行入职和故障排除。

  • SiriusXM的AI AgentHarmony管理订阅级别和试用期。

  • 公司正在构建面向客户的定制化AI Agent,以增强品牌体验。

  • AI Agent预计将扩展到客户服务之外,处理所有公司运营。

  • Sierra在这一领域的转型中处于领先地位。

Bret Taylor: 为了提供一个具体的例子,如果您购买了一款新的Sonos扬声器或遇到技术问题,比如令人头疼的橙色闪烁灯,您现在将直接与由Sierra驱动的Sonos AI互动,以协助进行设备上手和故障排除,无论是硬件问题还是Wi-Fi问题。 同样,如果您是SiriusXM的订阅用户,他们的AI AgentHarmony将处理从升级和降级订阅级别到在您购买新车时管理试用期等任务。

广义而言,我们帮助公司构建品牌化的面向客户的Agent,这些Agent是他们品牌和品牌体验的重要组成部分。这一点尤其引人注目,因为就像20世纪90年代中期网站的兴起一样,我们可能会在未来回顾今天的Agent时感到一种怀旧之情。 最初,许多Agent专注于客户服务,这是一个很好的应用案例,但我相信在三到四年内,您的Agent将涵盖公司运营的所有方面。

例如,想象一下,在一家保险公司,您可以提交索赔、比较计划,或在您的孩子到了可以考取驾照的年龄时,将他们添加到您的保险费中——所有这些任务都将由您的Agent处理。这就是我们正在帮助公司构建的,而Sierra正处于这场变革的前沿。

Sarah Guo: 最初专注于面向客户方面,嗯

  • 大多数客户是消费公司,与B2B公司相比差异不大。

  • 人工智能显著降低了客户对话的成本,从13美元降至不到1美元。

  • 成本降低使公司受益,尤其是拥有大量客户基础的消费品牌。

  • 由于成本效益,数字自助服务体验得到推广。

  • 潜在的更频繁客户互动,正在改变客户体验。

Bret Taylor: 面向客户的公司,我们绝大多数客户都是消费类公司。从技术上讲,B2B公司与消费类公司之间并没有巨大的差异,除了它们拥有的客户数量不同。我总是喜欢从第一性原理出发思考,这项技术实现了哪些以前不可能的事情。

如果你考虑一次对话的典型成本,如果你今天拨打客服中心,大多数服务团队的关键指标之一是他们的每次联系成本,即完成一次电话通话的全部劳动力和技术成本。对于大多数电话通话,服务成本大约为13美元。通过人工智能,你可以将这一成本降低到远低于1美元,实际上将对话成本降低了整整一个数量级。

如果你对此进行数学计算,公司将从这种成本降低中受益最多。根据数学方程,无论是分子还是分母,如果你以数百万消费者为单位进行衡量,对于消费类公司来说,价值确实不同。对于许多消费品牌来说,进行对话是一件非常昂贵的事情,而且并不一定容易实现。有整个网站专门用于查找公司电话号码,因为在某些方面,它们并不十分以消费者为中心。

你将这些转向数字自助服务体验。我现在非常兴奋的是,与客户进行对话的成本降低了整整一个数量级;也许你可以多做整整一个数量级的对话。这实际上意味着什么?随着这些技术趋势,我认为你通常会从数字化当前所做的事情开始,但我实际上认为第二级效应将是,既然进行对话不再是高昂的成本中心,我实际上希望如何将对话作为客户体验的关键部分?

所以回到你的问题,我认为与拥有大规模消费客户的公司进行的对话比与拥有100个客户的B2B公司进行的对话更有意义。这并不意味着它没有价值,但影响程度和决策差异是相当不同的。

  • 主要挑战:将基础模型整合到公司Agent环境中。

  • 其他挑战:确保兼容性、可扩展性和伦理考虑。

Sarah Guo: 描述在公司Agent环境中利用基础模型能力并使其发挥作用的一些关键挑战。 其中一个主要挑战是...

  • 检索增强生成 (RAG): 一种结合大型语言模型与外部数据库的技术,使AI响应基于特定内容。

  • 客户体验: 与品牌的多数互动涉及行动而非问题,需要跨多个系统的复杂流程。

  • AI平台: 目标是创建一个能够协调复杂流程并设置护栏的平台,平衡AI Agent的创造性与业务和合规目标。

  • 技术和社交挑战: 挑战在于编程非确定性创意软件的同时保持控制并确保品牌一致性。

Bret Taylor: 我认为你们可能在播客中讨论过的这些技术在今天非常普遍。其中一种技术被称为检索增强生成。本质上,这涉及使用一个大型语言模型,而不是仅仅依赖模型在预训练过程中获得的固有知识来生成答案,而是将其与一个内容数据库结合起来。你指示模型使用这些内容作为真实来源,并要求它总结该数据库中的选定内容。这是一种迂回的说法,即如果你能将Agent基于你提供的信息,你也可以将现成的模型与专有的业务数据整合。这是一种目前非常流行的技术,也是一个令人兴奋的领域。

然而,我们在实践中发现,这种广泛的技术投资类别对于几乎任何有意义的客户体验来说都是极其低效的。

如果你考虑一下你与你在意的品牌之间的所有互动,这些对话中有多少是在提问?可能一个都没有。这一切都是关于采取行动——升级或降级订阅、退货、交换保修、向保险公司提出索赔。所有这些行动不仅涉及回答问题,还涉及对可能超过十个记录系统的操作。这是一个非常复杂的过程,通常既有业务目标,如防止取消,也有合规目标,特别是在医疗保健等受监管的行业。

这意味着构建能够基于内容定位的Agent的想法是一个很好的演示,但不一定是一个有影响力的产品。这是我们真正试图解决的技术氛围。我们正在尝试创建一个平台,您可以在其中编排任意复杂度的流程,而不仅仅是让AI拥有代理权,还要有护栏。过去二十年的大多数软件系统都是快速执行的规则引擎,无论这些规则是在源代码中实现还是在低代码平台中实现。现在,我们正在转向一个以目标和护栏为导向的世界。企业现在有机会不仅将业务流程表达为一组规则和决策树,而是通过说明他们试图实现的目标以及他们希望AI拥有代理权的地方——他们希望AI具有创造力的地方,以及他们不希望AI具有创造力的地方。

这是一个非常有趣的技术问题,但也是一个社会和商业问题。许多公司一开始会说他们想要精确控制AI的行为,这是一个很好的目标,我们的平台确实支持这一点。然而,如果你这样做,它可能会相当机械化,并且你实际上正在消除人们在参与像ChatGPT这样的事物时感受到的许多魔力,这本质上涉及创造力和代理权。另一方面,如果你将代理权调到最高,比如11,你可能会得到幻觉,它可能会违反你的政策,或者更微妙的是,它可能不会成为你品牌的优秀代言人。

我认为我们正在尝试构建一个更深入的东西,即如何针对非确定性的创造性软件进行编程?我们需要构建哪些抽象来表达目标和护栏,以便你不会消除使这些体验愉悦的创造力和代理权?这就是为什么ChatGPT比历史上任何服务都更快地达到1亿用户,但也为什么你可以向董事会、CEO和客户表示有适当的护栏到位。这是一个非常有趣的技术问题,我认为它也是一个新的设计问题,几乎是一个哲学问题,关于你希望在软件中以一种几年前无法讨论的方式注入多少创造力。你希望注入多少?

  • 讨论在核心基础模型或大型语言模型(LLMs)之上开发高级功能,如推理引擎和模块的发展。

  • 考虑公司是否应继续自行开发这些功能,还是期望由OpenAI或Anthropic等公司将其整合到核心模型中。

Elad Gil: 我认为你提到的那些不同方面,比如护栏,或者在某些情况下,我见过人们在开发Agent构建自己的推理引擎和其他模块,这些模块建立在核心基础模型或大型语言模型之上。 作为一家公司,你认为有多少工作需要自己继续做,又有多少最终会整合到OpenAI或Anthropic等核心模型公司中?

  • AI市场预计将类似于云市场,由少数几家主要基础设施提供商主导。

  • 基础设施即服务(IaaS)提供商如AWS、Azure和Google Cloud控制了云市场中大部分的资本支出(capex)。

  • 由于高昂的资本支出要求,初创公司发现建立自己的数据中心或IaaS业务在经济上不可行。

  • 在AI市场中,少数几家公司可能会处理预训练,这是模型构建中资本密集的部分。

  • 高资本支出要求使得初创公司在预训练中实现投资回报变得困难。

Bret Taylor: 如果你不介意,我想退一步来谈谈我对市场的看法,然后再回答那个问题。这里有一句马克·吐温的名言:“历史不会重演,但会有相似之处。”我相信人工智能市场将会与过去15年的云市场有相似之处。

如果你看看那段时间的发展,广义来说,最终你会看到只有少数几家基础设施即服务(IaaS)提供商,它们代表了云资本支出(capex)投资的绝大部分。 大多数软件即服务(SaaS)公司向这些基础设施提供商支付租金,比如亚马逊网络服务、Azure或谷歌云。同样,由于规模经济和数据中心的发展,对于初创公司来说,无论是自建数据中心还是建立基础设施即服务业务,从资本支出的角度来看,都不太合理。那种关于资本支出的正反馈循环并没有实现。

我认为类似的情景很可能会在前沿模型上演。我们最终会看到相对较少的公司进行预训练,这是模型构建中真正资本密集的部分。 这并不是因为它们是唯一拥有优秀研究者的地方,而是再次从资本支出的角度来看,如果你想要真正从资本支出中获得回报,你确实希望将其出租给大量用户。对于许多公司,尤其是那些已经进行预训练的初创公司来说,从长远来看,这种投资回报在数学上是值得怀疑的。

  • 由于容量和成本限制,主要的云服务提供商预计将占据主导地位。

  • 在单一云服务提供商上运行应用程序和数据,在访问第三方服务时可能会引入延迟。

  • 这种主导地位可能导致次要的购买行为,涉及审批、预算和安全考虑。

  • 市场可能会围绕这些主导的云服务提供商进行整合。

Elad Gil: 最终,似乎主要的云服务提供商,或者可能还有一两家额外的参与者,将会占据主导地位。 这是由于固有的容量和成本效益限制。此外,如果你将所有应用程序和数据都运行在这些云服务提供商之一上,然后向第三方服务发出请求,会增加延迟,产生往返延迟。

Bret Taylor: 这引入了次要的购买行为,

Bret Taylor: 涉及审批、预算和安全考虑。

Elad Gil: 那么,你认为市场会大致在这些云服务提供商周围整合吗?

  • 云服务提供商可能会与主要研究实验室合作。

  • 安全和延迟问题仍然是关注的焦点。

  • 大多数企业使用多个云服务提供商和SaaS,重点关注服务级别协议(SLAs)。

  • 少数基础模型构建者将主导预训练。

  • 像Scale AI这样的工具公司将提供必要的软件和工具。

  • 解决方案将至关重要,类似于云服务,以解决特定的业务问题。

  • AI解决方案的价值应与模型更新解耦,以确保长期可行性。

Bret Taylor: 我认为最终会形成云服务提供商与主要研究实验室合作的格局,这大致是目前的情况。我并不完全相信在安全性延迟方面的问题已经解决,但有趣的是,现在大多数大型企业都使用多个云服务提供商。许多企业使用软件即服务,并不一定关心软件托管在哪里,只要满足安全性和可靠性要求即可。虽然有例外,但由于20年的软件即服务发展,人们的期望已经演变为不问你从哪里获取电力,而是问你的服务级别协议(SLA)是什么。这可能是一个积极的趋势,但仍需克服有意义的延迟和安全问题。我并不完全相信所有都在同一底层架构中是解决方案,但我确实看到了软件即服务的演变。

回到我的主要观点,我认为将会有相对较少的基模型构建者进行预训练。将会有一个工具公司的市场,例如Scale AI,这可能是AI领域的一个很好的例子,类似于云行业的Snowflake。这些工具公司就像淘金热中的镐头。如果你正在转向云端,你需要软件;如果你正在将AI引入你的业务,你需要工具和软件。最后一类是解决方案。就像在云时代,你可以从亚马逊网络服务、Azure或GCP获取服务并构建几乎任何东西,但大多数公司想要解决一个问题。构建自己的CRM或ERP系统的总拥有成本是不合理的,公司花了很长时间才意识到这一点,但现在他们已经意识到了。对于AI来说,情况大致相同。如果你想自动化客户服务,使用现有工具比自己构建更容易且成本更低。如果你想自动化部分法律流程,使用现有工具可能比自己开发更合理,原因与软件即服务相同。

总的来说,回到你的问题,你如何构建技术以及基模型提供商将做什么?我认为关键在于你提供的价值以及如何解耦这种价值。你是否在模型之上增加了足够的价值来成为一个真正的公司?如果每次AI模型的新版本都降低了你的价值,这可能表明你实际上不是一个解决方案;你可能只是在模型之上增加了一些微小的价值。不幸的是,有许多初创公司似乎符合这种描述。

  • AgentOS平台:一个客户可以定义其客户体验目标和护栏的平台。

  • 技术整合:整合新技术以提高案例解决率、客户满意度和减少负面体验。

  • 价值主张:平台提供的价值不仅依赖于模型改进,更在于提升客户体验。

  • 价值谷底:如果模型改进构成提供价值的主要部分,可能存在潜在危险。

  • 基础模型:并非所有用例都将源自基础模型,类似于15年前并非所有公司都会构建自己的SaaS。

Sarah Guo: 你知道,这并不是关于Sierra在模型改进时所提供的价值。

Bret Taylor: 如果我们工作得当,我们的平台就会变得更好。我们的客户使用我们称之为AgentOS的平台,本质上是在定义他们客户体验的目标和护栏。每当有新技术可用,能使这项工作更有效时,我们就会将其整合进去,从而带来更好的案例解决率、更高的客户满意度和更少的负面体验。这类似于任何来自SaaS公司的网络服务随着更好技术的应用而改进。然而,客户聘请我们做的并不是与模型相关,而是与他们的客户体验相关。从根本上说,这是我们处理问题的方式。作为一名企业家,我认为如果你不 fit into 其中一个类别,至少在我看来,是有风险的,因为当模型改进出现时,确实存在价值问题。如果那占据了所提供价值的50%,你就处于价值的诡异谷中。但我确实认为,所有用例都将来自基础模型的观点可能是错误的。预测未来很难,但我想那就像是15年前说不会有任何SaaS公司;每个人都只会自己构建。

Sarah Guo: 或者从那些企业提供的乐高积木来说也是如此。

  • 大型零售商通常缺乏自行实施所有事项的资源。

  • 对大多数公司来说,投资于软件即服务(SaaS)平台至关重要。

  • 基于角色的Agent提供了有意义的创新机会。

  • Agent解决独特的难题,如编码、开发者工作流程、安全性和编程语言。

  • 依赖编码Agent可能导致团队治理和代码审查等二阶效应。

Bret Taylor: 是的,实际上我认为情况可能恰恰相反。 大多数企业,尤其是那些工程师相对较少的大型零售商,并没有足够的资源去自行实施所有事情。他们需要决定在哪里进行创新并脱颖而出。对于大多数公司来说,借助“水涨船高”的效应,投资软件即服务(SaaS)平台至关重要。 我在这里看到了同样的趋势,并且我对“Agent”这个概念非常看好。创建基于角色的Agent的公司显然会存在竞争,但我相信在那个领域存在有意义的机会。我可能会与他们合作,而不是依赖基础模型提供商的支持,因为他们正在解决独特的问题——编码Agent、开发者工作流程、安全性、不同的编程语言等等。我认为这里面蕴含着巨大的价值,并且依赖编码Agent可能还会带来次级效应,比如团队治理、代码审查以及其他方面。虽然我现在可能还没有足够深思熟虑去一一列举,但这就是这个领域存在公司的原因,并且我对它的长期存在非常看好,即使我还不知道所有的细节。

  • 通过将SaaS与基础模型上的说唱歌手进行类比,讨论了某些公司可能面临的淘汰风险。

  • 这种比较暗示了一些SaaS服务,如Shopify和Salesforce,可能会面临类似的挑战。

Elad Gil: 你说得对,SaaS的类比非常贴切,因为人们经常谈论基于基础模型的说唱歌手以及这些公司如何逐渐消失。 你可以认为很多SaaS就像一个基于SQL数据库的说唱歌手——它们有些相似,而我

Bret Taylor: 认为现在的一组Shopify和Salesforce服务也是如此。

  • 提到的公司曾是Salesforce长期的重要供应商。

  • 尽管它们的重要性,这些供应商最终被取代。

Sarah Guo: 这些公司都非常优秀,它们长期成为Salesforce的重要供应商,这很有趣。 然而,它们最终被取代了。

  • 基础模型在云市场中提供显著价值,并为各种解决方案创造机会。

  • 不同的应用公司可以选择不同的模型,促进健康竞争。

  • 面向未来对Sierra客户至关重要,以避免新技术带来的问题。

  • 提示工程和底层工具对许多解决方案至关重要,但并非所有公司都适用。

  • Sierra的商业模式专注于基于成果的定价,与客户的商业模式相一致。

  • AI领域向基于成果的定价转变,其重要性不亚于软件即服务的出现。

Bret Taylor: 最终,关于云市场真正有趣的地方,如果你接受我的类比——类比有时可能很危险——那就是基础模型提供商都从这项投资中受益。我确实认为这些基础模型具有巨大的内在价值,任何基于这些模型构建的解决方案都将从所有那些惊人的用例中收取“税”,这对所有参与者来说都是好事。

正如你所提到的,不同的应用公司可以在不同时间选择使用不同的模型,这创造了大量健康的竞争。对Sierra客户来说,最重要的是未来保障,确保客户不会在新技术出现时陷入某种东西崩溃的可怕境地。更有意义的是,当伟大的新技术出现时,客户可以从中受益。

对于这个领域的许多解决方案和应用公司来说,他们提供的主要价值之一是通过提示工程或使用低级工具。这些模型并不严格意义上更好;代币和模型之间有着非常紧密的契合。虽然有一些有趣的工具,但大多数公司可能不应该或不愿意在那个层面操作。就像你的公司不想了解数据库迁移一样——这很无聊但很重要——软件即服务提供了无停机时间的优势。

Sarah Guo: 你不需要关心那个。

Bret Taylor: 另一个有趣的事情是Sierra的商业模式它专注于基于结果的定价,按完成的工作收费。我看到这个领域的许多初创公司采用这种模式,这是软件即服务在AI时代另一个强大的方面。最优秀的AI公司正在将他们的商业模式与客户的商业模式对齐,按结果收费。我认为这是一个非常强大的新商业模式,可能和订阅式软件的理念以及软件即服务的出现一样强大,提供开箱即用的解决方案,并将你公司的实际商业模式与结果对齐,这非常有意义,并且与为代币付费有显著不同。我认为建立这种对齐至关重要。

  • 客户是有价值的,致力于提供有价值的解决方案体现了信心和雄心。

  • 解决方案公司通常比现有解决方案提供显著的价值提升。

  • 经济学家将软件视为生产力的驱动力,例如微软Excel彻底改变了财务部门。

  • 软件对生产力的影响在过去20年中非常显著。

Sarah Guo: 您的客户非常宝贵,而对这一点的承诺表明了您对这些解决方案价值的极大信心和雄心。这并非小事,但解决方案公司在行业中最令人兴奋的一点是,您确实看到了与现有解决方案相比的价值提升。

Bret Taylor: 如果您与经济学家交谈,他们会讨论软件作为生产力的驱动因素,有时是以非常抽象的方式。当然,如果您看看财务部门在微软Excel出现前后的情况,它肯定推动了生产力——就像使用计算尺与Excel,或计算器与Excel相比。当然,它推动了生产力,但在过去的20年里,它一直相当...

  • 从增量收益转向企业销售中的可衡量投资回报率。

  • AI系统可以在有保护措施的情况下自主执行任务,更接近直接归因。

  • 以从印象广告转向按点击付费广告为例。

  • 公司应要求软件供应商提供更高的实际价值标准。

  • 合同分析和呼叫中心运营等功能的可量化价值。

  • 供应商与公司关系的转变,由于可衡量的价值,使供应商成为真正的合作伙伴。

Sarah Guo: 确实,每个人都是

Bret Taylor: 与其关注渐进式的收益,企业销售周期中的每个人都展示了关于投资回报率(ROI)的幻灯片。 有多种ROI计算方法,虽然不完全错误,但许多采购和IT专业人士已经看过无数次这样的演示。他们经常质疑这些演示是否真的减少了部门人数或衡量了这些结果。

在人工智能时代,这些系统可以在适当的保护措施下自主采取行动,使我们更接近软件实际执行可衡量任务的阶段。这有点类似于从基于印象的广告过渡到按点击付费的广告。 即使你并不完全专注于交易,你也在更接近直接归因,这是有价值的。公司愿意为点击支付更多费用,因为越接近直接归因,其价值就越大。

这对公司来说是一个很好的趋势,因为它们应该对软件供应商提出更高的要求,并更接近实际价值。 这种转变类似于法律和编码服务,使你能够看到分析合同等功能产生的价值。现在你可以量化价值,知道你会为任务X、Y或Z支付多少顾问费用,或者呼叫中心每个联系人的成本。

这是显著的,并将改变软件供应商与公司之间的关系,使供应商成为真正的合作伙伴,因为交付的价值是可衡量的。 这是一个非常积极的变化,因为首席信息官(CIO)经常难以看到他们从购买的软件中希望获得的价值。

  • 自动化显著改善了客户支持工作流程。

  • 高调的例子,如Clara,展示了净推荐值和客户满意度的提高。

  • 自动化减少了700名代表的团队规模,增强了业务功能。

  • 自动化的应用正在扩展到各个领域,包括编码、客户成功和销售生产力。

  • 法律和其他行业预计将成为下一波自动化采用的浪潮。

Sarah Guo: 对,你知道区别在于……

Bret Taylor: 沮丧,是的,沮丧,这很复杂。我认为这是……

Elad Gil: 非常积极趋势。 也许一个非常高调的例子是Clara,他们公开谈论了如何有效地实施客户支持工作流程来服务于他们自己的业务。我认为最终结果是净推荐分数大幅提高,客户满意度提升,每个客户所需时间减少。他们基本上自动化了一大批工作流程,同时还将团队规模缩减了,我记得是700名代表或员工。所以这在他们业务运作方式、处理客户的能力以及支持的语言等方面都产生了巨大影响。所以现在似乎出现了这些非常显著的例子,展示了你所谈论的巨大影响。

Bret Taylor: 我认为影响已经显现,这也是为什么我对应用领域的许多公司感到非常兴奋,因为我认为它们现在更接近于实际价值,而不是广泛地……你认为有哪些……

Elad Gil: 你提到的其他关键应用领域?我认为目前企业采用最多的三个领域基本上是编程、客户成功……

Bret Taylor: 我认为目前有很多努力……

Elad Gil: 正在进行的是销售生产力或销售和市场营销生产力。还有其他你认为……你提到了法律。还有其他你认为近期最有可能……

Bret Taylor: 下一个浪潮的这些领域,你知道……

Elad Gil: 非常清楚这些事情将会……

  • 演讲者对自动化分析师角色,特别是后台分析,感到兴奋。

  • 目标是增强而非取代分析师的角色,将其比作分析师的“钢铁侠战衣”。

  • 分析师的高级角色涉及综合复杂数据以向利益相关者提供洞察。

  • 大型语言模型(LLMs)擅长总结、综合和推理,因此可能对这一角色有用。

  • 然而,LLMs在没有大量工作的情况下可能难以处理数值或表格数据以及特定领域的复杂性。

  • 微调和特定领域的专业知识对于在这一领域的有效应用至关重要。

  • 分析师的角色在不同部门可能有所不同,但在大型企业中,许多人参与使数据具有可操作性。

Bret Taylor: 这将非常有影响力。 我不确定这是否只是一份工作,但我对自动化分析师的角色感到非常兴奋,尤其是后端分析,不仅仅是替代而是增强它——就像为分析师打造的钢铁侠战衣。如果你思考分析师的高级角色,它的职责是综合复杂数据,为利益相关者提供洞察。

如果你考虑大语言模型(LLMs)擅长的基础原理——总结、综合、推理——有一些有趣的应用。然而,语言模型在未经大量工作的情况下,并不一定擅长处理数值或表格数据。特定领域的数据可能具有复杂性或隐含意义,这些在基础模型中并不存在。这使得它成为像编程或法律这样的领域,其中微调和特定领域的专业知识是有益的。

我不确定“分析师”是否只是一个单一的角色;不同部门可能有不同的分析师。但如果你观察一家大公司,你会发现有多少人的工作是将数据转化为可操作的策略。

  • 转型涉及增强和使流程更加有效和实时。

  • 从复杂的业务规则引擎转向更灵活和高效的系统。

Sarah Guo: 在你的演示中,你提到了所有这些方面。

Bret Taylor: 我认为,一些转变涉及替换,或者我不确定,但肯定是增强和使事物变得更加高效和实时。我也觉得这非常令人兴奋。

Sarah Guo: 我们能回到你提到目标和护栏的时候吗?正如你所描述的,我们正在远离业务中的复杂规则引擎。

  • 重点在于代表客户思维方式重大转变的软件。

  • 讨论围绕如何评估SierraAgent的性能以及帮助用户适应新系统展开。

Bret Taylor: 这款软件代表了客户思维方式的重大转变。

Sarah Guo: 你如何与他们合作,评估SierraAgent的表现,并帮助人们适应它?

  • 技术焦点: 与客户合作,正式化和定义流程,强调程序性知识和系统集成。

  • 运营方法: 开发工具,使客户体验团队能够直接控制和改进AI Agent。

  • 客户互动: 从结构化菜单转向*形式的对话式AI,实现更广泛和更自然化的客户体验。

  • 长尾体验: 识别未预见的客户互动,并适应这些长尾体验的需求。

Bret Taylor: 接下来,我将介绍一些技术方面的内容,然后更深入地探讨运营方面。

从技术上讲,我们与客户密切合作,以形式化和定义他们的流程。有时客户带着明确的流程来找我们,有时则没有。我们认为一个Agent不仅由事实知识组成,还包括程序知识——理解流程的含义,以及与系统的集成。

我们花了很多时间讨论你希望在哪里设置护栏,在哪里鼓励创造力,以及在哪里赋予代理权。然后我们进行了大量的实验,实时运行概念验证,并面对真实用户的冷酷现实,看看你是否达到了预期的效果。

基于此,我们为客服团队开发了许多工具。我们认为AI不应该仅限于技术团队。负责客户体验的团队,无论是首席数字官办公室还是正式的客户体验团队,都应该掌握这些体验的方向盘。

我们构建了许多工具和平台,这些团队可以在这些平台上审计和改进Agent,并直接控制Agent随时间的行为。这不是一个孤立完成的事情;这是一个非常有机的过程。

如果你想象自己是一个零售商,访问一个零售网站,可能会有一个菜单覆盖所有类别——男装、女装、鞋子、裤子等——你点击它们来过滤列表。此时有一个标准的零售模板,虽然不一定最好,但这是我们生活的世界。

如果你想象有一个对话式AI Agent,它是一个*格式的文本框,完全*格式。这有点像从雅虎目录到谷歌搜索。你有一个你可以做的所有事情的分类,但然后你有一个*格式的文本框,问你想让我们做什么。

因此,它往往比人们最初考虑的要广泛。通常会有一些长尾客户体验,不仅我们没有为Agent设计,我们的客户也没有预料到。我认为这是一个非常有趣的深层问题。

Sarah Guo: 我们谈到了一个疯狂的欺诈退货案例,没有人知道发生了什么。

Bret Taylor: 没错,这实际上是客户的声音。我认为这是一个非常令人兴奋的动态。有一本书叫《长尾理论》,我经常把它与谷歌联系在一起。我认为可能是埃里克·施密特为它写了前言,如果我没记错的话。

随着互联网从目录转向搜索,网页数量增加,你不仅得到了大型流行网站,还得到了博客的长尾。这是网络的一个显著部分,我认为我们在客户体验方面也在朝着这个方向发展。

你为你的客户策划了几个屏幕,但如果你转向一个AI Agent的世界,你可以说,“对不起,我无法帮助你”,但你会更像是按数字绘画。这是我们的客户想与我们谈论的事情;我们如何满足这种愿望和需求?

这是一个非常有趣的客户洞察与开发客户体验的新方式的结合。

  • AI系统被描述为需要不断调整的自适应有机体。

  • 重点在于赋能客户体验团队来管理这些系统。

  • 新兴的客户行为和外部事件影响AI的演进。

  • AI演进与保持客户体验团队自主权之间的平衡至关重要。

  • 未来的期望包括语音模式、视频化身以及AI表现的真实性等进步。

Sarah Guo: 更加有机的经验,因此它们会随着人们的学习而适应。

Bret Taylor: 这是一个始终在线的系统,它不仅仅是像运行A/B测试那样;它有点不那么受控。它是一个系统,或者一个有机体,你不断地在调整它。我们平台的很大一部分是关于如何赋能客户体验团队来管理这个系统

Sarah Guo: 我认为新案例,新兴的客户行为,而不是模型。

Bret Taylor: 行为,完全正确。今天在野外发生了什么新情况?外部事件、争议、曾经流行但被改变的产品。你如何不仅从中获得洞察,而且还能不断地以一种不剥夺客户体验团队代理权的方式进化这个Agent,他们的工作就是定义这个,同时还能拥抱AI的自然、有机、新兴行为?

Sarah Guo: 如果你向前滚动,我不知道,六个月,12个月,今天我们有一个文本框。语音模式即将到来,视频化身已经存在。我们应该期待什么?Sierra化身像你或Clay那样,或者更人格化的东西,Richard,保真度重要吗?

  • 观察Sierra AI Agent可以发现其具有多样化的个性。

  • AI Agent可以通过指令调整来评估和反映用户情感。

  • AI Agent可以根据不同的品牌语调进行定制,从幽默到优雅。

Bret Taylor: 确实如此,观察一些Sierra AI Agent在其自然环境中的表现,并见证每个Agent中截然不同的个性,实际上是非常有趣的。 我认为你的AI Agent应该担任品牌大使的角色。大型语言模型的一个显著特点是它们能够通过指令微调来评估与其互动的人的情感,这种机制使得这些大型语言模型具有对话能力。 它们自然地反映了用户的情感和语气,但你也可以控制和修改它以适应你的品牌。如果你想要一个不拘一格的品牌,你可以实现这一点。如果你更喜欢一个更优雅的品牌,比如一种奢华的混合物,你也可以拥有它。你们能做到这一点吗?

Elad Gil: 作为提示的一部分,你们会进行后训练吗,或者你们是如何将其实施到你们的流程中的?

  • AI模型可以根据特定品牌语调和体验进行定制。

  • 监督模型,即AI监督其他AI,是平台的关键部分。

  • 个性化的AI体验可以反映用户的语言和个性。

  • AI可以通过减少等待时间和提高解决效率显著改善客户服务。

Bret Taylor: 所有这些元素的结合意味着,根据模型的不同,某些语气品牌方面的特征适合用于提示。然而,品牌中的一些部分更为敏感;例如,你不会希望你的AI Agent提供医疗或财务建议。我们非常关注我们称之为监督模型的东西,即模型监督其他模型。我们办公室的玩笑是,每个AI问题的解决方案都是更多的AI,这既令人兴奋,也是我们平台的关键部分。我们手头有许多工具来解决有意义的问题,这确实令人兴奋。

想想苹果的品牌体验,无论你参观他们在库比蒂诺的办公室,还是走进一家苹果商店,开箱体验都是一致的。你看到“加州设计”,感受到苹果的体验。同样,你应该将你的Agent视为品牌体验的一部分,因为它可以拥有因人而异的不同个性。这从15年前黑色星期五活动的统一性到如今我们所见的个性化体验,是一个重大转变。

虽然我们不为客户规定具体的个性,但可能性本身就令人兴奋。反射回说话者的语言,而不是呼叫中心员工的语调,能够实现某种令人难以置信的共情,这在以前是成本高昂的。聊天、语音和视频头像的愉悦和个性将令人震撼,就像与品牌进行FaceTime通话一样。

你关于Clara用例的观点至关重要。我们不能低估这对消费者的影响。糟糕客户体验的头号原因是等待,尤其是在客户服务中。大多数入境互动都涉及某些不对劲的地方,无论对方的人多么高效,即时解决是不可能的。这就是AI的用武之地,推动客户满意度指标。这不是对之前处理这些互动的人的指责;他们本质上处于劣势,因为排在第10位,处于等待中。

  • 即时满足是人工智能驱动的客户服务系统的核心价值。

  • 人工智能可以通过单一Agent支持多种语言,提高效率。

  • 人工智能可以快速适应新产品或变化,减少培训时间。

  • 人工智能能够处理俚语、术语和习语,这是人类Agent面临的挑战。

Sarah Guo: 对,所以这是一个规模不匹配的问题。

Bret Taylor: 当你脱离等待状态时,你已经不那么开心了。另一边优秀的人或许能扭转这种局面,但这个机会是即时的,我认为这非常了不起。我的意思是,这就是我试图提醒我们的客户:不要过度思考。即时满足实际上是这些系统的主要价值之一;其余的都是……

Elad Gil: 附加价值。是的,甚至是你如何考虑人员配置,因为你突然可以用一个Agent支持多种语言,而你知道,对于人类来说,很难掌握30种语言。所以即使是这些方面,正如你所说,确实会影响队列和客户。

Bret Taylor: 俚语、行话和习语。我认为期望一个人会说10种语言是完全不合理的。不,一个术语,知道这个。嗯,你还有很多非常微妙的东西。比如说,你的公司推出了一款新产品。想想看,要重新培训5000名呼叫中心的Agent关于这款新产品需要多长时间。而通过AI,你只需按下一个按钮就能做到。所以,这项技术有很多有趣的、你知道的,次级效应,对每个消费者都非常有益。