AI Agents与Agentic AI正重塑未来:前者是高效执行任务的数字助手,后者则是能自主决策的学习型大脑。从自动驾驶到医疗诊断,它们正在颠覆行业规则。

自 2024 年底 Anthropic 发布 MCP,将 AI 与 API 连接,人造大脑从此便有了“手脚”。从 AutoGPT、Manus 到各类垂直的新Agent产品,短短月余间智能体百花齐放,诸多创业公司走完了从技术突破到产品落地的长路。昨日还是科幻故事中的幻影,今天便已触手可及。

产品与生态碰撞,期望与信心交织,2025年终被冠以“Agent 元年”之称

Agent 产品成为创业公司新宠,百花齐放之际,如何真正落地?从不同市场对 Agent 的需求出发,博主今天就与四位嘉宾探讨了 Agent 的前沿技术、模型效用提升与评估方案,以及 SaaS 生态之下 Agent 产品战略方向。

创业总伴随着创新,四位嘉宾在对谈中还分享了各自从 day one 便开始坚持的非共识。事易时移,其中有些今天仍在经受行业的审视,也有些慢慢变成了共识,Agent 技术的脉络就藏于其中。

Agent 商业化问题成为本次圆桌的关注焦点,几位嘉宾分别提出了独到见解。朱哲清指出,Agent 在很大程度上是让 SaaS 生态更加集成化,在软件工具高度标准化的海外市场,Agent 产品与 SaaS 相辅相成。

“我们畅想的未来,是任何 business 和专业用户的 workflow 都可以被 Pokee.ai 完全取代,最终不管是生成还是执行,都真正做到在没有human in the loop 的情况下,也可以端到端地完成任务。”

AutoAgents.ai 的商业化思路另辟蹊径,“卖铲子”、“定场景”两步走。杨劲松认为,新技术出现的早期总会出现对相应基础设施的需求,当头部企业将技术应用于具体业务,就可以一窥潜在价值更大的场景。循着这一思路,AutoAgents.ai 在寻找那些 Agent 能够提效五至十倍的场景。

“这些场景一定可以做出不一样的东西。”张天乐则表示,Agent 商业化最核心的问题是交付结果,艾语智能追求让客户在传统作业方式和他们的方案之间无缝切换。“甲方需要的是你帮他解决问题,而不是你用 AI 帮他解决问题。”

Agent 协作同为今年热门话题,MCP、A2A 始于海外,先后掀起 Agent 协议热潮。作为 ANP 开源技术社区发起人,常高伟看法冷静:“协议受制于基模能力,没有非常好用的智能体,智能体间的连接需求也就不会特别多。”

虽然落地为时尚早,但探索技术和构建影响力已经可以提上日程。ANP 正与标准化组织和开源社区合作构建 Agent 协议生态,积极在各个开源框架中寻找一席之地。

百花齐放之后,Agent 如何落地

  1. Pokee.ai (朱哲清/Bill) - 全球Agent执行平台:

    • 定位: 打造通用Agent执行平台,核心是“一个Prompt完成生成+执行”的端到端闭环。目标用户是开发者和专业用户

    • 差异化:

      • 海量工具集成: 已集成上万工具(社媒、文档、聊天等),覆盖复杂工作流。

      • 屏蔽集成复杂性: 用户无需关心底层集成与认证。

      • 赋能垂类Agent: 为聚焦特定场景的垂类Agent公司(如AI SDR)提供统一的执行层能力,助其构建更复杂闭环。

    • 价值主张: 取代冗长人工工作流,构建自动化互联网,解决“最后一公里”部署问题

  2. AutoAgents.ai (杨劲松) - 企业级Agent构建平台:

    • 定位: 企业级Agent构建与应用基础设施,聚焦可用性、安全性与垂直场景深度

    • 市场策略:

      • 大客户先行: 优先服务国央企/头部企业(电网、三桶油等),因其预算充足、落地要求高(长任务精准度、安全)。

      • “铲子+垂直”策略: 先提供易用的Agent构建工具(卖铲子),再基于客户实践挖掘高价值垂直场景(如审计),实现按结果收费

    • 技术路径:

      • 端到端优化: 强调模型微调、工具深度整合(非简单连接)、业务数据闭环。

      • 构建垂类最强Agent: 目标是在细分领域打造超越人类专家的Agent,吃掉场景核心价值。

    • 与Glean区别: 超越企业内搜,聚焦业务精准执行

  3. 艾语智能 (张天乐) - 垂直场景的结果交付者(新型律所):

    • 定位: 深耕法律垂直领域直接交付法律服务结果,自身即是新型AI律所。

    • 差异化与市场选择:

      • 中美差异应对: 认识到中美律师付费能力、市场环境巨大差异,避开Harvey的SaaS工具模式。

      • 创新避“卷”: 选择传统律师服务不足的新增市场(小额网贷逾期调解、知产侵权追索),避免存量竞争。

      • 结果导向: 坚信技术发展终将支持结果交付,从Day1就逼迫公司以此为目标。

    • 核心洞察: “选择大于努力”,关注海外技术先进性,但商业模式必须本土化创新;做增量市场,伴随技术能力提升向结果收费演进。

  4. ANP社区 (常高伟) - 协议层创新者(构建智能体互联网基础):

    • 定位: 开源、中立、非营利社区,致力于定义智能体间通信协议 (ANP),目标是成为智能体互联网的HTTP。

    • 差异化:

      • 开放互联网愿景: 坚信未来是基于开放协议的智能体互联网(Agentic Web),打破平台封闭生态。

      • 技术特性: 强调P2P架构本地决策保护隐私(vs A2A任务分包)、创新性采用DID去中心化身份(类比Email互通性),解决智能体互信与身份核心问题。

      • 生态建设: 通过W3C社区组汇聚产学研力量(华为、谷歌、字节、MIT等)。

    • 非共识坚持: 协议是最高效、最AI原生的连接方式;开放协议生态是释放AI生产力的关键。

共识与启示:

  • 中国ToB务实路径: 杨劲松和张天乐都强调在中国市场,交付可衡量的结果/价值(效率颠覆、解决实际问题)是商业化核心,弱化纯工具属性或SaaS思维。

  • 垂直场景深挖价值: 无论是杨劲松的工具切入后深挖场景,还是张天乐的直击痛点交付结果,都凸显在特定垂直领域做深做透的重要性。

  • 生态位差异化: 四家公司分别占据平台层(Pokee)企业应用基建层(AutoAgents)垂直结果层(艾语)底层协议层(ANP),展示了Agent赛道丰富的可能性。

  • 创新是破局关键: 面对挑战(中国市场特殊性、技术瓶颈、竞争),坚持非共识创新(如ANP的开放协议、艾语的增量市场、Pokee的超强集成、AutoAgents的端到端优化)是立足之本。

Agent 创业,从非共识出发

一、常高伟:智能体协作与互联网形态的重构
  1. 智能体协作以协议为核心
    • 认为协议是智能体协作最高效的原生方式,因智能体擅长处理底层数据,而协议是承载数据的最佳形式。目前该观点正逐步成为行业准共识。
  2. Agentic Web(智能体互联网)的未来
    • 现有互联网以平台(如微信、淘宝)为中心,形成封闭生态;未来智能体互联网将以协议为中心,实现开放连接。例如,个人智能助手可通过协议直接连接企业智能体,完成预订、购物等操作,弱化传统平台的中介角色。微软已提出类似概念,印证该方向的潜力。
二、张天乐:商业场景选择与 “经验优先于聪明”
  1. 复杂场景与垂直领域的价值
    • 认为大模型普及后,通用 Agent 可能覆盖多数简单场景,创业机会应聚焦复杂文书(如法律)和复杂流程,选择 “难切入” 的领域深入挖掘,而非追逐通用能力。
  2. 模型 “经验” 比 “聪明” 更关键
    • 现有技术路径过度追求模型推理能力(如 “变聪明”),但现实任务(如法律工作)更需要 “经验”—— 即处理细分场景中大量细节、特例的能力(如法院开庭设备、沟通时机等)。经验应通过外挂式 “百科全书”(非修改模型参数)实现自学习与优化,而非单纯提升模型智能。
三、杨劲松:Agent 工作模式的创新
  1. 放弃 “角色分工”,强化 “高密度智力动用”
    • 早期尝试将 Agent 按人类分工(如产品经理、开发者)拆分角色,效果不佳,反而限制能力。更有效的方式是让模型从不同角度反复加工任务(如共享工作记忆、多路对抗处理),通过提升工作密度和维度对抗,优化输出质量,比串行结构的角色分工更高效。
  2. 对抗式协作与动态记忆
    • 主流 Agent 系统多为串行结构,易放大幻觉和错误。通过共享工作记忆、多路并行处理任务,可提升结果质量,解决上下文断裂与复杂任务效率问题。
四、朱哲清:检索推理与模型能力边界
  1. 检索需融入推理,而非单纯 RAG
    • RAG(检索增强生成)依赖固定相似性度量,无法处理复杂推理需求(如夏威夷旅游推荐中多维度物品的关联)。未来企业级 Agent 的检索应结合推理,而非仅靠 RAG。例如,法律场景中需从判例法中通过逻辑推理提取经验,而非简单匹配。
  2. RL 的核心是泛化性,而非记忆
    • RL(强化学习)的价值在于目标驱动的推理和规划层面的泛化性,而非让模型 “记忆” 经验(如法律条款)。模型应通过预训练构建基础逻辑链,经验则通过外部检索(如动态数据库)获取,避免因强行记忆而损失泛化能力。
五、延伸讨论:经验的技术实现
  • 张天乐:经验可抽象为 “触发条件(Trigger)+ 动作(Action)” 的数据库,通过模型每天并发处理数据自动提炼,与模型训练解耦,实现快速迭代(如每天生成 700 条经验)。
  • 朱哲清:美国法律公司通过积累 “地检 / 法院偏好” 数据库辅助决策,印证经验需在实践中动态收集,而非依赖离线数据。
  • 杨劲松:“Agentic RAG” 结合业务逻辑推理与检索,拉取相关经验提升模型效果,是当前热门研究方向,但 RL 在动态状态空间中的应用仍需突破。
结论:非共识的核心脉络

嘉宾的非共识观点均围绕 “如何突破现有技术框架限制” 展开:常高伟关注基础设施(协议与互联网形态),张天乐与杨劲松聚焦应用层的场景选择与工作模式,朱哲清则从模型底层能力(推理与检索)切入,共同指向 “智能体从通用能力向垂直场景深度落地” 的关键路径。

更好的模型效用,更好的效用评估

关键观点与实践:

  1. 自动化评估与难点(朱哲清/Bill):

    • 基础调用可评估: LLM已能较好评估单一工具调用的正确性(参数、选择),可实现半自动化检查

    • 端到端评估是核心难点: 最困难的是评估最终行动结果(如写入Google Doc的内容是否正确)。这需要贯穿整个工作流(规划、工具选择、参数、结果)的评估机制,是端到端打通的关键挑战。

  2. 场景化与客户导向评估(杨劲松):

    • 评估需紧贴场景: 评估标准高度依赖具体客户和应用场景,非标准化

    • 构建自动化评估工具: 根据客户核心任务和主链路,整理测试数据(输入+预期输出),开发自动化评估工具。

    • 分层迭代: 对验证问题分层,持续迭代模型能力。评估维度(如准确度、可解释性)需按客户需求定制。

  3. 业务创新优先与信息赋能(张天乐):

    • 警惕“唯AI论”/“唯评估论”: 建议“先人类法则,后AI法则”。有时业务模式创新(如催收场景中设计“红白脸”Agent群组协作)比单纯优化模型话术更有效。

    • 提供充分信息,减少干预: 在复杂、无标准答案的场景(如法律评估),将更全面、自由的信息交给模型(如历史沟通、法院记录),减少人为控制,模型常能给出更合理的判断(如区分“好/坏”分期案例)。

    • 强调追求交付结果优化,而非机械评估。

  4. 协作效率与理解一致性(常高伟):

    • 当前更关注智能体间连接和通信效率的评估。

    • 重点评估:智能体间数据理解的一致性以及建立连接的低成本性,这是协作的基础。

总结与共识:

  • 端到端结果验证是硬骨头: 评估工具调用的最终效果是通用难题(朱哲清)。

  • 评估必须场景化: 脱离具体应用场景谈评估无意义,需紧密结合客户需求和任务链路(杨劲松)。

  • 评估服务于结果: 避免过度追求评估指标,业务创新和信息赋能有时比模型微调更关键(张天乐)。

  • 协作评估聚焦基础: 智能体协作评估首要解决理解一致性和连接效率(常高伟)。

Agent 商业化前途何在

关键观点与策略(杨劲松):

  1. 市场潜力巨大: 坚信Agent市场规模远超传统云/SaaS(十倍于云)。

  2. “卖铲子”策略(早期):

    • 聚焦基础设施: 商业化早期瞄准“卖铲子”——提供构建Agent所需的基础设施/工具链。

    • 差异化切入: 相较于开源工具,提供企业级、更易被严肃客户接受的商业化工具链解决方案。

  3. “铲子”引路,挖掘垂直场景(中期):

    • 工具落地驱动场景发现: 通过卖出的“铲子”在客户实际应用中,观察并识别Agent能显著提效(5-10倍)或部分端到端完成的高价值垂直场景

    • 结果导向收费: 在已验证的高价值场景中,转向按交付结果收费。

  4. 案例:审计行业突破:

    • 痛点显著: 高度依赖昂贵人工专家处理paperwork,行业分散。

    • 价值创造: Agent处理大部分中间工作,专家仅负责验证/签字,实现10倍以上人力节省

    • 收费模式: 凭借颠覆性效率提升,可按结果收费,甚至可能颠覆行业格局。

关键观点与策略(张天乐):

  1. 技术驱动商业模式: 当前Agent/LLM能力的飞跃,使“交付结果”成为更自然的商业化方式。

  2. 客户视角优先(弱化AI标签):

    • 强调解决问题而非技术: 对甲方(尤其金融机构)弱化“AI”概念,聚焦于“解决问题”本身,降低切换成本。

    • 无缝切换: 确保方案能与客户传统工作方式无缝衔接。

  3. 核心能力:Planning(规划):

    • 认为Agent最强能力在于Planning,而非Chatbot。

    • 构建Planning能力强的核心Agent进行任务全局规划和分解。

  4. 人机混同,渐进替代:

    • Task驱动协作: 建立基于Task的交互体系,机器下达Task,人/Agent执行Task,实现人机在统一体系内协作。

    • 平滑过渡: 目标是逐步降低人力占比(Agent替代人),但接受人机混同的中间态是必经之路。并非所有岗位都能或需要立即被替代。

    • 交付最终结果: 这种人机协同的组织形态本身就是交付给客户的最终价值。

共识与核心挑战应对:

  • 为结果付费是王道: 两位都强调在中国市场,客户更愿意为实际交付的结果而非效率工具本身买单。

  • 区别于人力外包: 张天乐指出关键在于利用Agent的Planning核心能力驱动整个工作流,并构建人机融合的新组织形态,目标是实现渐进式的高效替代,而非简单提供人力。

  • 聚焦高价值场景: 杨劲松的策略突出识别能带来数量级效率提升的场景是商业化成功的关键。

  • 务实落地: 张天乐的“隐形AI”策略(弱化技术强调结果)和杨劲松的工具链切入都体现了在中国ToB市场的务实态度。

Agents 生态如何建立

  1. 海外生态优势(朱哲清/Bill):

    • SaaS标准化程度高: 美国企业普遍使用大量标准化SaaS(如JIRA, Salesforce, NetSuite),信息化和SaaS渗透率高。

    • Agent作为集成层: Agent的核心价值在于成为统一的“集成层”和“操作入口”。员工只需通过prompt即可调用所有集成的SaaS工具,极大提升效率,实现“Single Prompt to All Tools”。

    • Agent可移植性强: 由于底层SaaS工具标准化,一个在A公司训练/集成的Agent,在B公司有较高复用可能性。

  2. 国内生态挑战(朱哲清、杨劲松):

    • 缺乏统一标准: 企业解决方案多由外包定制开发或自建,接口不统一,形成“信息孤岛”。

    • 集成困难: Agent难以在不同公司间复用,需要在每家客户从零开始集成,成本高、效率低。朱哲清直言“直接放弃”尝试打通国内生态。

    • 现状封闭: 杨劲松指出当前国内生态仍非常封闭,与海外差距明显。

  3. 生态构建路径与现状:

    • 协议标准化(常高伟): 通过参与W3C等国际标准化组织建立影响力,并与开源社区合作开发框架和工具,推动智能体协议(如ANP/A2A)的普及和兼容性。目标是支持主流开源框架。

    • 大厂联盟驱动(杨劲松): 国内大厂正推动建立自己的MCP协议联盟,可能倒逼头部SaaS厂商开放能力,最终形成统一的Agent入口。

    • 当前工具集成的局限(朱哲清): 即使如Zapier集成了大量工具,也存在问题:(1) 许多API非AI原生,难衔接;(2) 集成功能浅层(如仅发帖),无法支撑复杂的企业级工作流(如跨平台营销监控与决策);(3) 依赖固定的workflow,缺乏灵活性。

  4. 未来方向与瓶颈:

    • AI Native协议: 常高伟和朱哲清都强调需要更AI原生的连接和协议。

    • 模型能力是关键瓶颈(常高伟): 当前缺乏足够好用的单体Agent,导致智能体间连接与协作的需求尚不强烈。突破基模能力限制是生态繁荣的前提。

    • 智能工作流(朱哲清): 未来的Agent需能基于模型能力动态规划和执行复杂、长链路的工作流,而非依赖预设脚本(如RPA)。

结论: 海外依托高度标准化的SaaS生态,Agent发展环境更优;国内生态封闭、标准缺失是主要障碍。构建生态需双管齐下:推动协议标准化(常高伟路径)与大厂联盟倒逼开放(杨劲松观察),同时克服当前工具集成的局限性和提升基模能力。AI Native的连接和智能工作流编排能力是未来关键。

长上下文与动态记忆,Agent 走向未来

  1. 性能与成本(常高伟): 当前Agent执行复杂任务(如协议调用预定酒店)耗时过长(5-6分钟)且成本高昂,主要源于协议调用对上下文资源的巨大消耗。提升响应速度和降低成本是其最迫切的需求。

  2. 记忆机制(张天乐、杨劲松):

    • 认为当前RAG(检索增强生成)机制不够本质,期待更先进的Memory(记忆)技术

    • 希望实现高效、自动化的信息检索、记忆、遗忘(过滤无用信息)和修正,提升匹配效率和正确率。

    • 杨劲松补充指出,现有Agent在长任务中容易丢失上下文(“断掉”),依赖工程手段恢复,限制了处理复杂长链路任务的能力。动态记忆被视为解决上下文问题的关键。

  3. 上下文长度与效率(杨劲松、朱哲清):

    • 现有128K上下文仍显不足(输入消耗大,输出短),期待突破百万级甚至更长

    • 更期望出现根本性机制创新,使上下文不再成为瓶颈(如底层Memory基础设施)。

    • 朱哲清提出“大型概念模型”(Large Concept Model)方向:用概念嵌入(Concept Embedding)进行自回归生成,再解码成文本,可极致压缩检索、生成过程和上下文需求。同时关注扩散模型文本生成(Diffusion Model Text)可能带来的速度与成本优势。

  4. 其他亮点(Aha Moments):

    • 自我迭代(常高伟): 观察到Agent能在协议调用失败后自动修正请求并成功重试,展现了强大的自主学习和适应潜力。

    • 用户记忆粘性(杨劲松): ChatGPT的记忆功能带来的个性化体验粘性极强,是未来产品的重要方向。

    • 工具调度与3D生成(张天乐): 赞赏用强化学习(RL)解决未来海量工具调用问题的思路;关注文生3D技术(如AdamCAD)的结构性潜力。

最后总结

Agent智能体并非是通往AGI的最终形态。未来AI Agents 和 Agentic AI 都在以不同的方式改变世界。AI Agents 擅长自动执行重复性任务和处理特定操作,而 Agentic AI 则通过决策、从经验中学习以及解决复杂问题来突破 AI 的极限。两者都是塑造未来科技和我们生活方式的宝贵工具。

Logo

全面兼容主流 AI 模型,支持本地及云端双模式

更多推荐