提高对金融工作流程中代理人工智能的信任,仍是当今技术领导者的一项主要优先任务。
过去两年,企业纷纷将自动化代理投入实际工作流程中,涵盖客户支持和后台运营。这些工具在检索信息方面表现出色,但在多步骤场景中,它们往往难以提供一致且可解释的推理过程。
解决自动化不透明问题
金融机构尤其依赖海量的非结构化数据来撰写投资备忘录、进行根本原因调查以及执行合规检查。当代理人处理这些任务时,任何无法追踪确切逻辑的情况都可能导致严重的监管罚款或资产配置不当。技术高管们经常发现,如果没有更好的协调,增加更多的代理人只会带来更多的复杂性,而不会增加价值。
开源人工智能实验室Sentient今日推出了Arena,该平台被设计为一个实时且具备生产级性能的压力测试环境,使开发者能够针对复杂的认知问题评估各种相互竞争的计算方法。
Sentient的系统复制了企业工作流程的真实情况,故意向代理提供不完整的信息、模糊的指令和相互冲突的来源。该平台不会对工具是否生成了正确输出进行评分,而是记录完整的推理轨迹,以帮助工程团队随着时间的推移逐步调试故障。
构建可靠的金融自主代理人工智能系统
在生产部署之前对这些能力进行评估,已经吸引了众多机构的关注。Sentient已与包括Founders Fund、Pantera以及资产管理巨头富兰克林邓普顿(管理着超过1.5万亿美元的资产)在内的多家公司合作。初始阶段的其他参与者还包括alphaXiv、Fireworks、Openhands和OpenRouter。
富兰克林邓普顿数字资产管理公司首席执行官朱利安·洛夫表示:“随着企业寻求将人工智能代理应用于研究、运营和面向客户的工作流程,问题已不再是这些系统是否强大或能否生成答案,而是它们在实际工作流程中是否可靠。
“像Arena这样的沙盒环境——智能体可以在真实、复杂的工作流程中进行测试,且其推理过程可被检查——将有助于生态系统区分有前景的想法和可投入生产的能力,并增强人们对这项技术如何集成和扩展的信心。”
Sentient联合创始人希曼舒·泰亚吉(Himanshu Tyagi)补充道:“人工智能代理不再是企业内部的实验;它们正被纳入与客户、资金和运营成果相关的工作流程中。
“这种转变改变了关键所在。一个系统在演示中给人留下深刻印象还不够。企业需要知道,在故障代价高昂、信任脆弱的实际生产环境中,智能体是否能可靠地推理。”
金融等敏感行业的组织需要可重复性、可比性,以及一种方法来追踪可靠性改进,无论他们为代理式人工智能(AI)使用何种基础模型。通过整合Arena等平台,工程总监能够构建有弹性的数据管道,同时使开源代理功能适应其私有内部数据。
克服集成瓶颈
调查数据凸显了雄心与现实之间的差距。虽然85%的企业希望成为自主企业,且近四分之三的企业计划部署自主代理,但拥有成熟治理框架的企业却不到四分之一。
从试点阶段发展到全面实施阶段对许多人来说都颇具挑战。这是因为当前的企业环境平均运行着十二个独立的代理程序,这些程序往往各自为政,互不关联。
开源开发模式通过提供基础设施来加快实验进程,从而指明了一条前进的道路。Sentient本身作为ROMA和Dobby开源模式等框架背后的架构师,为这些协调工作提供协助。
关注计算透明度可确保在自动化流程对投资组合提出建议时,人工审核人员能够准确追踪该结论是如何得出的。
通过优先考虑能够记录完整逻辑轨迹的环境,而非仅仅关注孤立的正确答案,在金融等运营领域集成代理式人工智能的技术领导者可以获得更高的投资回报率,并在其整个业务中保持监管合规。
