AI Agent大变天!谷歌开源A2A,一夜改变智能体交互

AIGC开放社区
10 Apr

昨晚,谷歌在Google Cloud Next 25大会上,开源了首个标准智能体交互协议——Agent2Agent Protocol(简称A2A)。

A2A将彻底打破系统孤岛,对智能体的能力、跨平台、执行效率产生质的改变,支持Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等主流企业应用平台。

简单来说,这个A2A交互协议有点当年谷歌牵头80多家企业搞安卓系统的味道,因为首批就有50多家著名企业加入。随着加入的企业越来越多,会极大提升A2A的商业价值以及推动整个智能体生态的快速发展。

开源地址:https://github.com/google/A2A

在本次大会上Agent成为了重点,除了A2A之外,谷歌还效仿OpenAI开源了Agent开发套件ADK,内部测试工具Agent Engine,新的Agent市场等。下面“AIGC开放社区”先为大家解读A2A的重点内容。

什么是A2A

A2A是一种开放协议,为Agent提供了一种标准的交互方式,使它们能够相互协作,无论底层框架或供应商是什么。

例如,一家大型电商公司使用了多种企业平台和服务。Atlassian 用于团队项目管理,Box 用于文件存储和共享,Salesforce 用于客户关系管理,Workday 用于人力资源管理。

以前这些平台上的Agent无法自由通信。现在通过A2A协议,这些企业平台可以安全、自由地自动化交互数据。

在与合作伙伴设计协议时,谷歌遵循了五个关键原则。第一,A2A专注于使Agent能够在它们自然的、非结构化的模式下进行协作,即使它们不共享内存、工具和上下文。谷歌正在启用真正的多Agent场景,而不是限制Agent成为一个工具。

第二,该协议是基于现有的、流行的标准构建的,包括HTTP、服务器端事件(SSE)、JSON-RPC等,这意味着它更容易与企业日常已经使用的现有IT堆栈进行集成。

例如,一家电商企业日常使用 HTTP 协议来处理网页数据传输,利用 JSON - RPC 在前后端传递数据指令。引入 A2A 协议后,企业的订单管理系统可以通过HTTP 与 A2A 协议对接,快速获取相关智能Agent提供的物流数据更新,无需大费周章地重新搭建复杂的数据传输通道,能轻松融入现有的IT架构,让各个系统协同工作更加顺畅。

第三,A2A被设计为支持企业级的认证和授权,在推出时与OpenAPI的认证方案具有对等性。这点还是很人性的不排斥OpenAI,使用A2A 协议能快速通过身份验证,安全地获取数据,保障数据传输的安全性和合规性,防止数据泄露风险。

第四,谷歌设计A2A使其具有灵活性,能够支持从快速任务到可能需要数小时甚至数天(当人类参与其中时)的深入研究等各种场景。在整个过程中,A2A可以向用户提供实时反馈、通知和状态更新。

以一家科研机构为例,研究人员利用 A2A 协议下的Agent进行新药物研发相关研究。简单的任务如快速检索数据库中已有的药物分子结构信息,几秒内就能完成并反馈给研究人员。但对于复杂任务,像模拟新药物分子在人体环境中的反应,可能需要数天时间。

在这期间,A2A 协议会不断向研究人员推送模拟进度,比如已经完成了多少步骤、当前遇到的问题等,让研究人员随时掌握情况,就像时刻有个助手在汇报工作进展。

第五,Agent的世界不仅限于文本,所以,A2A支持各种模态,包括音频、图像和视频流。

A2A工作原理

A2A的工作原理是通过促进客户端Agent和远程Agent之间的通信来实现的。客户端Agent负责制定和传达任务,而远程Agent则根据这些任务采取行动,以提供正确的信息或执行相应的操作。在这个过程中,A2A协议有以下几个关键能力。

首先,Agent可以通过“Agent卡”来宣传它们的能力。这些“Agent卡”是以JSON格式存在的,它们能够让客户端Agent识别出哪个远程Agent最适合执行特定的任务。

一旦确定了合适的远程Agent,客户端Agent就可以利用A2A协议与之进行通信,将任务分配给它。

然后,任务管理是A2A协议中的一个重要环节。客户端和远程Agent之间的通信都是围绕完成任务展开的。协议定义了一个“任务”对象,这个对象具有自己的生命周期。

对于一些简单的任务,可能可以立即完成;而对于一些复杂的、长期的任务,Agent们可以相互沟通,以保持对任务完成状态的同步。当任务完成时,其输出被称为“工件”。

此外,A2A还支持Agent之间的协作。Agent们可以相互发送消息,这些消息可以包含上下文信息、回复、工件或者用户指令。通过这种方式,Agent们能够更好地协同工作,共同完成复杂的任务。

最后,A2A还具备用户体验协商的功能。每条消息都包含“部分”,这些部分是完整的内容片段,例如,生成的图像。

每个部分都有指定的内容类型,这使得客户端和远程Agent能够协商所需的正确格式,并且明确包括用户界面能力的协商,比如iframe、视频、网络表单等。这样,A2A就能够根据用户的需求和设备的能力,提供最佳的用户体验。

哪些企业加入了A2A

其实最让人惊讶的就是,A2A刚发布就获得了大批著名企业的青睐和加入,包括埃森哲、波士顿咨询集团、凯捷、科尼、Salesforce、德勤、甲骨文、HCL科技、印孚瑟斯、KPMG、SAP、麦肯锡、普华永道等50多家日常大家能经常听到的企业。

首批加入A2A的企业

还有一些技术公司也加入了到了A2A协议中。例如,Atlassian以其强大的团队协作工具Jira和Confluence而闻名。通过加入A2A,Atlassian能够使其工具与各种Agent无缝协作,从而进一步提升团队的工作效率和协作能力。

Box是一家专注于企业级云存储和内容管理服务的公司,它提供的解决方案能够帮助企业安全地存储、共享和管理文件。通过A2A协议,Box可以使其服务与Agent相结合,实现更高效的内容管理和自动化工作流程。

Intuit知名的财务软件公司,QuickBooks和TurboTax,已经被广泛应用于财务管理和税务处理。通过A2A协议,Intuit可以使其软件与Agent协作,实现更自动化的财务流程和更高效的税务处理。

MongoDB是一家提供高性能、开源的NoSQL数据库解决方案的公司,其数据库广泛应用于现代应用程序的数据存储和管理。通过A2A协议,MongoDB可以使其数据库服务与智能Agent相结合,实现更高效的数据管理和自动化数据处理。

其实看到这里大家应该都清楚了,谷歌就是想统一Agent混乱的格局,打造全新的执行、交互标准,这个比前段时间的MCP要猛的多啊~

本文素材来源谷歌,如有侵权请联系删除

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10