微信公众号
微信小程序
【摘要】 大模型的战争基本结束了,接下来,智能体才是企业真正创造效益、打造自己核心竞争力的核心抓手。
“行业里慢慢有了个共识:大模型的战争基本结束了,接下来,智能体才是企业真正创造效益、打造自己核心竞争力的核心抓手。”
这句话的分量,来自一种更现实的判断:当大模型越来越像“基础设施”,企业真正掏钱、真正验收、真正要落到业务结果的,往往不在“你用的是哪家模型”,而在“你能不能把概率性的回答,变成确定性的动作”。这一点同样被写进了深演智能对“最后一公里”的描述:企业要的是“稳定、可靠、能嵌进工作流、能被验证”的结果,不是更热闹的Demo。
近期,深演智能创始人兼CEO黄晓南与Morketing创始人兼CEO曾巧进行了一场关于All in AI Agent对话。问题追得很“甲方”:要不要All in?大模型竞争到底“结束”在哪一层?什么叫好用、什么叫管用?KPI谁负责?企业自己“手搓智能体”行不行?出了错谁背锅?
针对以上问题,黄晓南给出的主线很清晰:企业级智能体想跑通,先别急着神化AI——先把缰绳、工作流、数据保真、人的决策权这四件事,真正落到产品机制里。
01.为什么要All in AI Agent?
曾巧:两年前您就说要All in AI Agent,如今产品已经迭代到DeepAgent3.0版本了。回头看,当时为什么笃定押注企业级AI Agent?
黄晓南:2022年底大模型开始出现,之后一年半我们没有盲目行动,而是一直研究:这个技术对我们、对客户到底意味着什么。到2024年明确提出All in AI,其实是垂直聚焦企业级服务的智能体领域,主要两个原因。
第一,我们肯定大模型是划时代的技术,但也发现它在企业级场景里会暴露很多问题和局限,我们觉得找到了发展的突破口。
第二,我们有长期积淀。公司成立至今17年,当时已经有15年行业经验,对企业营销、销售、电商、运营等环节的痛点理解很深入。以前总觉得解决这些痛点的方法不够完善,但大模型出现,让我们在解决企业业务问题上实现了质的飞跃。
曾巧:你提到行业形成共识,大模型的竞争基本结束,接下来智能体才是企业创造核心价值的关键抓手。这里的“结束”到底指哪一层?你们把自己放在产业链什么位置?
黄晓南:“结束”不是说大模型不重要,而是说真正能参与到底层竞争的玩家,格局已经基本确定。底层竞争需要算力、顶尖技术团队、数据研发能力,这些是大厂优势。海外一开始大家关注OpenAI,后来谷歌实现翻盘;国内也类似,最终还是头部大厂成为主力。
深演要做的是AI应用层,而且定位明确:企业级AI,聚焦营销、销售、运营这些离资金、生意、用户最近、最能带来明确价值回报的场景。简单说,除了供应链、后端生产,其余更贴近增长的一段,是我们的主要战场。
02.AI Agent的现状与企业价值
曾巧:你们说要做“中国好用又实用的企业级智能体”。把这话翻译成大白话,什么叫“好用”?更快更省,还是能跑通全流程、对KPI负责?
黄晓南:我们内部先看“管不管用”,再谈“好不好用”,这不是一个层面。
先说“管用”,同一个问题十次里有一次回答错,大家就不会再用;或者任务完成度不够——让它做五件事只做了三件,也是不管用。企业服务里更关键:先把客户要解决的问题边界、规模定义清楚。定义太大AI做不了;定义太小又没价值——人工两分钟做完,AI只省半分钟,这种优化意义不大。
“好用”则是把门槛降下来。比如AI消费者调研产品,持续迭代后,用户只要用日常对话方式提出需求,就能得到一份完整调研结果,降低了专业操作门槛。“管用是基础,好用是升级。”
曾巧:好用、管用之后,大家更关心KPI。你怎么看“AI对结果负责”?
黄晓南:当我们说AI对结果负责,并不是说AI要对企业最终极的KPI负责。企业终极KPI需要先拆解成具体、可落地的问题,这一步还是要企业自己完成。在拆解出明确细分KPI后,我们能对效果提升做承诺。
举例,比如帮助导购、内部销售写搜索类营销文章,考核指标就是阅读量、点击率、留资有效性。客户用了以后,这些指标比不用AI时提升5倍——这种拆解后的KPI,是他们愿意负责的范围。

深演智能创始人&CEO 黄晓南
曾巧:你之前总结过企业级智能体落地的四个难点“稳定可靠、业务知识深度融合、上下文记忆、多智能体协同”。难在哪?哪个优先级最高?
黄晓南:最先卡住的一般是稳定可靠。大模型同一个问题每次答案可能不一样,这种不确定性在企业应用里不能接受。我们要通过输入业务信息、搭建标准化工作流和思考框架,让结果稳定、可复用,这是落地基础。
业务知识融合也很关键。大模型像刚毕业的博士生,看似无所不知,但对企业营销实操一无所知,必须像培训员工一样,用行业里最顶尖的专家知识去训练它;很多时候还要和客户共建专属知识,比如行业最优话术、企业自己的标准框架。
上下文记忆则对应企业连续流程:一项工作往往要分多步完成,做到最后一步忘了前面要求就没法用,所以要让智能体具备连续、长期记忆。
多智能体协同,是因为企业工作本身由多个子任务组成。人工智能领域的国际顶尖学者李飞飞也说过,AI擅长单个具体Task,但企业工作不是单Task。要让输出稳定、精准,就要把大任务拆成多个子任务,由多个智能体联动完成。
曾巧:你预判2026年企业级智能体三个关键词:任务完成度、多智能体协同、白盒化。这三个词背后,企业真正想买的“结果”到底是什么?
黄晓南:把“任务完成度”落到一条更接近业务结果的链路里。企业不会只为单点工具买单。就拿“打标签”来说,单点能力能提效,但企业未必买;如果进一步结合商品知识、购买行为,给出个性化跟进策略,再把策略落到沟通话术里,形成从“识别—策略—沟通”一条链,企业才愿意为这个结果付费。这里往往会用到企业微信(企微)这类日常沟通场景,把建议直接放进一线的动作里。
“白盒化”则是企业敢用的底线:决策逻辑、数据依据要可验证、可解释,而不是黑箱。比如用户运营旅程,他们不会让AI直接根据“提高复购”做全盘决策,而是把生成过程拆解成三步:
先用AI梳理企业历史旅程里的人群、内容、发送节点,找出最优运营因子;
再用小模型做更精准的预测,让大模型去调取结果;
最后再把人群、内容、时间节点做精准匹配、组装成旅程。
拆开后,每一步都能被验证、被复盘,企业才敢把它放进高风险的运营链路。智能体的价值说得更像一张采购清单:要能跑完整链路,要能解释每一步。
03.All in AI Agent,企业到底怎么落地?
曾巧:你提出2026年企业做智能体四个关键点:套缰绳、嵌工作流、保数据保真、人掌决策舵。它们分别在纠正哪些误区?
黄晓南:核心针对两大问题:一是把AI神化,过度夸大智能体能力;二是忽视数据真实性。
有些公司会跟客户说AI已经无所不能,让客户凡事交给AI,这其实是把AI神化。就算是在编程领域,资深工程师也需要最后把关;企业级智能体更是,目前我们的智能体还都处于L2到L3的水平,离完全自主决策的L4很远。智能体永远只做辅助决策,最终决策掌控权一定在人手里。
另一个误区是数据不保真。智能体不可靠,核心就是幻觉。企业级决策容不得虚假数据,所以“保数据保真”是一条生命线。
曾巧:如果智能体输出出错、决策偏差造成损失,谁来背锅?你们有没有把“可追责”的逻辑写进机制?
黄晓南:这又回到“人掌决策舵”。就像开L2级别自动驾驶,驾驶员必须盯着路、手放方向盘。现在不管大模型还是智能体,幻觉率都很高,这意味着使用AI的人所需要的专业能力不是变低,而是更高。
我们要把“可追责”落在“流程设计”上:让AI做全流程支撑和推导,让人只做核心输入和选择,减少中间无效干预。需求表达越清晰,结果越接近;信息缺失越多,偏差越大。
曾巧:你们怎么定义“数据保真”?怎么减少幻觉?又怎么用数据支撑企业的验收?
黄晓南:数据保真就是让智能体所有决策和输出基于确定、真实、可溯源的数据,而不是凭空生成。我们主要两方面做:第一依托企业一方数据,比如CDP这类经过业务验证的“单一真实来源”;第二帮企业搭建专属品牌知识库,把业务知识、产品信息、客户资料沉淀下来。
用一个更刺激的例子解释“为什么一定要保真”:之前我让大模型搜一份去越南的攻略,它给出了很多看似完整的内容,有博主名字、阅读量、文章标题,结果这些文章全是它编的。个人用AI还能“将就”,企业决策里这就是灾难。
所以我们还会用合规三方数据补充。深演智能深耕多年数字营销,连接了大量数据生态,知道哪些数据适配哪些场景、哪些真实有效。比如做小红书的营销策略,用大模型凭空生成容易“编”;但基于官方真实数据就更贴合实际。
曾巧:说到“值不值”,甲方更现实:不会只看概念,更关心投入能不能验收。能不能拿一个具体场景讲讲,怎么提效、怎么对比、怎么落到“能验收”的结果?
黄晓南:我就用“AI消费者调研产品”举例。很多客户会把过去线下做的同款调研搬过来:过去一次调研可能要花几十万,现在只需要几百块;过去完成调研要1–2个月,现在用AI只需要10–40分钟,而且两种方式得出的结果基本一致,能支撑品牌决策。
比如新品包装测试,传统做法要在全国找几千个不同城市、不同画像的消费者做线下调研,流程很繁琐。在AI消费者系统里,我们模拟出贴合中国10亿用户的AI消费者画像体系,每个画像都有精准标签,品牌在日常协作工具里操作,差不多半小时就能完成一次复杂测试。有客户用它选出的最优包装,和线下真实消费者调研结果完全一样——这类对照,本身就是最直观的验收。
它还缓解了传统定性调研的“失真”:线下访谈容易被引导,消费者也可能因为拿调研费而刻意讨好品牌;而AI消费者在规则约束下会更客观地反馈真实想法,还能用对话的方式做产品创新探讨,规模也没有限制,可以模拟海量不同画像。
曾巧:很多公司让员工“手搓智能体”先提升个人效率。您曾说过“个人没问题,但要对组织负责就是另一回事”。具体差异在哪?
黄晓南:个人层面的通用智能体,像个人助理,门槛相对低;企业级垂直智能体的差异在范围和深度。企业级背后要有大量优质数据、工程代码、行业专家知识和know-how、系统对接接口,还要做模型微调、RAG知识库等。个人手搓可能只是给“博士生”看了PPT;企业级要用系统方式培训它,让它具备真正业务能力,并满足可靠、多智能体协同、长期记忆、管用又好用等要求。
曾巧:如何产品化和交付?

Morketing Group创始人&CEO 曾巧
黄晓南:先讲产品化,再讲交付。
产品化上,DeepAgent的迭代节奏很清晰:2025年2月1.0、6月2.0 Pro,基本半年一迭代。3.0的核心是把“任务能力推到极致”,让智能体完成接近业务结果的完整任务;其次是全链路多智能体协同,每一个智能体底层都由子智能体组成,服务客户时还会和整个智能体系联动;同时还具备持续迭代底层能力,不断评测,“哪个模型效果好就快速切换”,不绑定任何大模型。
DeepAgent 3.0的智能体数量比2.0翻了一倍,并且与国内近200家头部客户共建,让智能体从真实痛点里打磨出来。
交付上,则是“70%通用能力+30%客户共创”。
曾巧:“70%通用能力+30%客户共创”怎么理解?
黄晓南:先纠正一个误区,不是70%的通用能力,而是70%靠我们自身能力就能落地:行业专家、技术团队、十几年营销know-how和AI技术,把智能体核心框架、基础能力搭好。剩下30%需要和客户共创,因为每个企业都有自己独有的业务逻辑、工作框架、行业分析思路,这部分必须融进去,智能体才真正适配。
曾巧:用智能体服务好中大型企业,需要满足哪些核心条件?
黄晓南:主要有三点:
第一,AI时代能胜出的还是行业老兵。所有的智能体落地,都基于我们对企业数据的理解、服务中大型企业的成熟逻辑和完整服务体系。
比如有些客户要求智能体对接指定的大模型,并非标准化SaaS方案,这就需要有多年企业服务的沉淀;而且现在见客户都是直接演示AI产品,不再靠PPT讲概念,这就让行业的准入门槛变得很高。
第二,必须有业务专家、数据科学家、工程师组成的“铁三角”团队,缺一不可。过去做软件是需求分析、写PRD、研发、测试的流水线模式,只要按流程走就能做出产品;但做企业级AI智能体,必须这三类角色紧密配合,围绕客户需求快速打磨、反复迭代。
我们几乎所有智能体都要迭代到第十版,才能达到“管用又好用”的标准,第一版甚至前几版基本都无法落地,而且迭代过程中还要不断解决实际问题,这个过程非常耗时,也极其考验团队的综合能力。
第三,对数据生态、企业数据有深度理解,同时有成熟的生态合作伙伴。比如我们的VOC用户洞察产品,需要清楚各类数据的获取渠道、适配的获取方式,还要和电商、平台、数据服务商等生态伙伴合作。没有这些长期积累,想让智能体真正落地到企业的业务场景里,根本不可能。
曾巧:我知道过去一年你们已经服务了数十家中大型企业落地企业级智能体,哪些案例算行业代表性?什么样的案例才算“方向对”?
黄晓南:代表性的案例要满足三个点。从单点能力走向链路化落地;能真正驱动业务结果;还要可复制、可规模化。比如在食品饮料、零售、美妆、汽车等行业落地,强调的是“动作链路”而不是“单点工具”。
举一个全流程新品创新的例子:先用智能体完成市场消费者心智洞察,基于洞察生成多个新品概念,再放到AI消费者系统里做概念测试,筛选最优概念,最终指导新品研发落地。这是多个智能体协同完成的闭环。
还有CRM私域运营的案例:过去只是搭MA系统,后来让营销自动化客户用上AI,从内容生成、设计到用户分析、圈层触达,全环节AI化,重构了企业私域运营流程。
曾巧:你觉得行业里做企业级智能体,最容易走偏的弯路是什么?
黄晓南:行业最容易走偏的地方有三类:只做单点工具,没有形成业务链路;闭门造车不与客户共创,脱离企业实际工作逻辑;忽视数据保真与技术打磨,迷信大模型能力,不做校验、不反复迭代,导致输出不稳定、幻觉多,撑不起企业决策。
曾巧:为什么很多AI产品最后落不了地?
黄晓南:过去不少产品做的是一个类似Code Pilot的侧边栏对话窗口,员工干一段工作就得停下来去问一次,最后会发现这种模式并不好用。相比之下,他更强调“AI原生产品”——如果大模型不能工作,产品就直接用不了,AI是产品的核心底层,而不是附加功能;也只有这样,AI才可能像“水融入水里”一样嵌进日常。
曾巧:如何落到最后一公里?
黄晓南:一定要“嵌工作流”。我们说Agent Light模式,本质就是把AI藏进企业每天用的软件里:不是多开一个对话窗口,而是让内容生成、数据分析、洞察输出变成系统原生能力:企业不需要为了用AI改掉原来的工作模式,渗透率自然才上得去。
曾巧:那你们怎么搭生态?怎么和大模型厂商、数据生态伙伴、系统软件伙伴、客户一起共建?
黄晓南:把生态共建拆成三块。
一是与大模型厂商通过API对接,保持对技术生态敏感和快速采纳;
二是和数据生态、系统软件伙伴深度打通,深演已经和企微、抖音、京东等平台全链路连接,做AI消费者时也会与京东共建更精准的用户标签;在一些巡店场景中对接高德地理数据;
三是与垂直领域knowhow伙伴共创,把外部经验与自家AI技术、系统能力融合,最终落到客户业务场景里。
这一整套“方法、数据、组织、生态、产品”拼到一起,企业级智能体不是“手搓一个workflow”,而是要把可用、好用、可验证、可规模化的能力,塞进组织的日常系统里。
曾巧:规模化为何能跑得快?
黄晓南:两点底层支撑。
第一是沉淀“原子能力”,把这些原子能力内化成可复用的技能(比如基于文本给用户打标签),新场景出现时就重新组合;第二是深演有十多年的营销know-how,以前不是不懂消费者调研、新品洞察,而是传统软件开发时间与成本太高,现在AI让这些know-how 能更快变成产品。
行业总说“软件行业已死”,其实我想说软件没有消失,只是解决问题的方法被AI颠覆了,我们做的是“AI软件”。
04.从“可用”走到“好用”
曾巧:作为企业级AI智能体决策领域的参与者,你们会怎么推动行业从“可用”走到“好用”?行业目前还缺标准、评估体系、数据治理能力,你们会不会牵头推动?
黄晓南:这件事难度不小。现在行业还没有太多统一标准,大家都聚焦在应用层,而不同应用场景差异很大。大模型领域有一些Benchmark,但应用层标准还在探索。说到底,客户的复购和实际反馈,还是衡量产品的核心标准。

左:Morketing Group创始人&CEO 曾巧;右:深演智能创始人&CEO 黄晓南
曾巧:那回到你们自己。深演一直强调长期主义,你们的企业愿景有没有迭代?2026年必须打赢的短期战役又是什么?
黄晓南:我们的愿景在2026年做了全新迭代:原来聚焦营销领域做决策AI,现在把场域扩大,定位成企业AI运营的头部 AI 应用平台。简单说,企业除了生产、供应链环节,其余业务问题我们都有能力、也愿意去解决,这一点也被客户服务成果验证。
短期必赢战役,就是让现有智能体在更多企业落地、发挥实际价值。今年我们定了“两个100个客户”的战略目标,核心是把使用门槛降下来,让不只是头部大型企业,中型企业也能享受到智能体价值。
曾巧:你说要降门槛,具体怎么落到产品和价格上?
黄晓南:过去我们按企业级软件标准售卖,合作门槛高。现在把DeepAgent上的智能体做标准化拆解,单个智能体合作门槛降到二三十万,并采用消耗型付费:企业可以按量付费,用量不够再充值,用量小的企业也能花少量钱用上智能体能力。
曾巧:最后给2026年所有想布局、落地企业级智能体的企业,提几条建议。
黄晓南:核心有两条。
第一,会用AI的企业终将胜过不会用的企业。AI不会直接淘汰企业,但使用AI的能力,会成为个人、团队乃至公司接下来最核心的能力,差距带来的效率和结果差异,可能是十倍、百倍甚至上千倍。企业如果还没开始尝试AI智能体,真的“时不我待”。
第二,落地智能体一定要从具体业务痛点、业务场景出发,而不是为了搭平台、做IT项目、赶热点。很多企业被“大模型私有化”“AI 一体机”概念裹挟,盲目投入却看不到价值。企业级智能体的核心是解决生意问题,尤其营销、销售这些贴近业务的板块——最终还是要回归企业自身的业务抓手。
大模型带来“可能”,但企业买单要“确定”。所谓竞争力,不是让AI更像人,而是让智能体更像一个能被组织使用的系统:能稳定复用、能嵌入工作流、能基于真实数据、能把黑箱做成白盒,也能让人始终握着“决策舵”。
Morketing原创发布,未经授权请勿转载
寒冬之下,营销人还该不该创业? | Morketing专访澄志创投CEO马良骏
AppsFlyer王玮:在竞争激烈的游戏营销现状下,脱颖而出的超休闲类游戏 | Morketing Summit 2018专题
请先注册/登录后参与评论