
阿里千问正在再行界说AI Agent的交易化旅途——不单是对话式交互的优化,而是顺利买通底层业务流的权限壁垒。本文通过外卖场景深度拆解,揭示千问如何用3秒绑定的‘主场上风’、意图直达的决策短路、以及复杂参数的无损映射,完成字节豆包未能突破的0到1进步。同期浓烈指出现时Agent在推选透明度、逆向进程、矛盾意图处理上的三约莫命短板。

阿里千问完成了字节豆包手机莫得完成的0-1。
“这不再是简短的功能堆砌,而是交互逻辑的颠倒:Agent 正在从一个‘对话框里的搜索引擎’,变成一个‘领有业务权限的数字代办’。”此前,豆包曾经尝试进步这说念门槛,却因生态兼容和第三方阻断而折戟。而领有舆图、外卖、购物全产业链的阿里,正在用千问展示一种“降维打击的践约壁垒”:当 AI 能够顺利退换自家底层业务流时,“这种基于底层业务公约(Protocol)的顺利调用,彻底杀死了第三方插件不得不面对的‘反应延伸’和‘跳端损耗’”。。
其他厂商该如何追逐?是去作念适配器,照旧再行凝视生态链?本文将深度拆解千问点外卖背后的 Agent 落地逻辑。
一、交互初体验:从“搜索弃取”到“意图直达”1.1 前置动作:权限托福的“一键化”记载在 Agent 的产物逻辑里,淌若说大模子是“大脑”,那么垂直业务的 API 授权即是“入场券”。莫得这张票,Agent 弘扬得再灵巧也只然而“说梅止渴”。
A.叫醒与触发:从意图到插件的“无缝捏手”
不同于以往需要去插件商场手动“装配”,千问对淘宝闪购/外卖能力的调用是意图驱动的。
操作记载:作为一个被千般‘由于政策原因无法拜访’弹窗虐过的产物司理,当我输入‘想点外卖’时,千问给出的不是冷飕飕的相接,而是一个权限请托的‘说明按键’,这种交互的‘确定性’才是 Agent 信得过落地的开动。”

PM 视角:这处置了 Agent 落地的一浩劫题——发现本钱。用户不需要学习如何开启 Agent,意图识别(Intent Recognition)顺利完成了功能分发。
B. 绑定进程:阿里生态的“主场上风”
这是整场测评中,最体现“亲女儿”特权的场所。我记载了通盘绑定旅途,耗时仅需 3秒傍边。
C. 中枢博弈:为什么极低的“摩擦本钱”才是 Agent 落地的分水岭?
作为产物司理,咱们必须看穿这个简短“勾选”动作背后的硬核壁垒。在 2026 年,通盘东说念主都知说念 Agent 强在逻辑推理,但落到实处,它更强在 API 背后那张“数字身份证”。
账号体系的“免死金牌”:通义千问之是以能秒开下单,是因为它顺利跳过了移动互联网期间最令东说念主浮夸的“考据码轮回”。阿里底层账号的买通,意味着用户在千问里的一句话,能已而退换他在淘宝千里淀了十几年的收获偏好和支付信用。这不仅是数据的流动,更是特权级的拜访后果。心理安全区的合围:跨集团的信任本钱是极高的。想象一下,让用户在抖音里绑定一个好意思团账号,那种“信息被转卖”的疑虑会顺利劝退 50% 的回荡。而在阿里生态内完成闭环,用户感知到的是原生系统的安全性,这种自然的心理兴奋区,让原来复杂的授权变得微不及说念。确定性托付:终止“脆弱的自动化”:好多厂商尝试用 RPA(模拟点击)去作念 Agent,这在演示时很酷,但在实操中是运维恶梦——一个赶快弹出的双 11 行径页或考据码就能让进程已而崩溃。而原生绑定的千问领有“白名单级”的 API 拜访权,这种“VIP 通说念”保证了即便在大促期间,下单进程依然安如泰山。本章小结:> “别总盯着参数看。千问的 3 秒绑定告诉咱们一个扎心的事实:Agent 能跑多远,不看大脑(模子)多灵巧,先看双脚(账号和权限)踩得够不够实。”> 这一步走得顺不顺(摩擦力是否弥散低),顺利决定了用户在“点外卖”这种高频场景下,是弃取享受便利,照旧在第二次看到登录框时就愤而卸载。
1.2 交互初体验:从“搜索弃取”到“意图直达”淌若说绑定账号是“入场券”,那么信得过的交互体验即是 Agent 的“基本功”。在传统 App 中,咱们被锤真金不怕火成了“搜索各人”;而在千问里,咱们正在变成“指示官”。
A. 旅途简化:决策链路的“短路”
在传统的 GUI(图形用户界面)下,点一次外卖意味着从用户心理动身。不错改为:“以前点外卖是在作念‘弃取题’(面对几百个商家),目下千问试图帮你作念‘判断题’。这种从‘列表式’向‘论断式’的进化,实质上是把决策的心理压力甩给了模子。”
传统旅途:掀开 App -> 首页弹窗干扰 -> 搜索 -> 满减/评分筛选 -> 进店选品 -> 说明结算。千问旅途:输入意图 -> 弹出说明卡片 -> 支付。PM视角:这实质上是将“弃取权”让渡给“算法预过滤”。千问不再提供一个长长的列表,而是尝试给出一个“最优解”。
B. 实测案例拆解
总结:千问在参数对皆能力出色,且通过“全网搜券”为用户提供了实打实的体感价值,但是在交互上,仅提供单一选项,且枯竭显性的推选原理,易激勉用户的“踩雷”急躁。时期上复杂任务逻辑断层,无法完成,复杂任务(预约点餐),存在逆向进程的盲区,无法完成售后任务。
案例 1(红榜):基础指示
在 Agent 的想象中,当用户给出“我想喝杯奶茶”这种很是微辞(Ambiguous)的指示时,是对系统预过滤能力最大的考验。
指示内容:“我想喝杯奶茶。”
交互弘扬:千问简直在秒级时候内顺利生成了一个具体的订单卡片(举例:奈雪的茶 – 霸气葡萄)。
后果看板:
旅途压缩:传统 App 需要阅历“搜索-比价-选店-选品-加购”约 6-8 次点击;Agent 样式下缩减为“输入-说明”2 步,操作步数从纯粹 60%。反应速率:极快,省去了加载海量信息列表的白屏时候。【作家总结:PM的批判性念念考】
“自然 2 步下单的爽感很足,但作为PM,我的第一反应是:‘凭什么推选这家?’。淌若 Agent 的逻辑只是在隔邻商家中赶快选一个,这不叫东说念主工智能,这叫‘抽奖’。好的 Agent 应该是决策的翻译官,而不是替用户作念主的独裁者。”自然“2 步下单”的旅途压缩在体验上很是丝滑,但从产物深层逻辑凝视,这种极致的后果掩饰了一个致命的“信任黑盒”问题。作为 PM,在咋舌于反应速率的同期,咱们必须保持警惕:
1. 推选原理的缺位(Transparency)
通往下单的终末一公里是“信任”,而非“速率”。通义千问顺利给出的单选卡片枯竭“Why this”的解说:
–
是基于我昨天的历史订单?
–
是基于该店发货最快、距离最近?
–
照旧全城销量最高的爆款? PM视角:枯竭透明度的推选在用户眼中继续等同于“强买强卖”。这种信息缺失会极地面拉高用户的说明本钱,以致激勉“算法罗网”的疑虑,导致用户为了求稳而跳回传统 App 再行搜索。
2. 单一解的博弈:独裁式交互的风险
奶茶是典型的“情怀化+千般性”品类,只给一个选项继续无法射中确切意图。目下 Agent 的逻辑是“我猜你想要”,这是一种典型的“独裁式交互”。更合理的旅途应该是“团员推选 + 极简 A/B 选单”:
–
优化逻辑:给出“你常喝的(复购偏好)”与“隔邻最火的(潮水偏好)”两个对比项。
–
中枢价值:通过增多 0.5 步的微操,用极低的知道本钱相通极高的决策确定性。
3. 信息密度(Information Density)的失衡
减少操作步数 ≠ 阵一火决策信息。目下的卡片信息(评分、月售、距离)过于精简。在点外卖场景下,用户的核肉痛点是“快”与“不踩雷”的均衡。当 Agent 过滤掉过多的商家配景信息时,用户现实上是失去了风险评估的能力。
案例 2(红榜):进阶指示——多见解意图下的“精深远参数对皆”
淌若说“点杯奶茶”是基本功,那么“多份订单 + 不同定制参数 + 特定地址”的组合指示,才是 Agent 信得过能称之为“就业助手”的分水岭。
测试指示:“帮我点 3 份去冰不加糖的伯牙绝弦,再要一份少糖的茉莉奶绿,送到公司前台。”
千问弘扬:
前置地址校验:第一时候反馈现时默许地址(XX 楼),并提供修改进口(安全说明逻辑)。复杂 SKU 映射:准确提取了 2 个品类、4 个维度的参数(份数、冷热、甜度)。自动寻优实践:触发淘宝闪购底层搜索,并在话术中体现“优先推选隔邻门店”与“自动叠券”。评价品级:优(进阶功能)
后果看板:从“手动挡”到“全自动”
【作家洞悉】:语义到参数的“无损压缩”
1.践约逻辑的深度拆解:为什么这很难?</strong
在 2026 年,大模子听懂“伯牙绝弦”这种独着名词还是不特别了。信得过的难点在于将微辞的自然语言强制映射为业务系统的硬性参数。
–
难点在于:系统后台的 SKU 规格频频是成百上千的 ID 组合。Agent 需要在纠合“去冰不加糖”的同期,精确勾选后端对应的那条独一属性旅途,并同步诡计门店库存。这背后不是简短的聊天,而是语义(NLP)与业务接口(API)的强耦合。
2.“省却 4 次点击”的体感差</strong
咱们常说的“惊喜感”,实质上是用户操作链路的剧烈压缩。在传统 GUI 界面中,用户为了省几块钱,继续要在各个页面领券、比对满减。 “这才是 Agent 的迷东说念主之处:它把‘找券比价’这种折磨东说念主的活儿变成了后台静默实践的插件,让用户只认真‘说明’,剩下的交给算法去薅羊毛 。”这种“自动找券”带来的不是虚伪的心理自在,而是实打实地让用户跳过了繁琐的营销套路,顺利拿到了最优解。
3.确定性考据(Verification Layer)</strong
千问在实践前先说明地址并指示“点击修改”,是一个相称熟悉的 Safe-Guard(安全护栏)想象。在波及钞票与位置的场景下,Agent 不应追求“一步到位”的粗率,而应在要津节点留出东说念主工说明的窗口,防护“高效地办错事”。
4.进化见解:UI
层的明细透明化</strong
自然内核弘扬优秀,但目下的 UI 反馈仍有擢起飞间。冷落在生成的订单卡片上,顺利标注出每份奶茶的具体定制明细(如:伯牙绝弦 x3 [去冰/不加糖])。这么用户无需点击插足笃定页,就能完成终末一步确切定性考据,进一步指责说明本钱。
案例 3(黑榜):语义冲突 —— 纠协力在“非轨范界说”下的失效
本案例旨在测试 Agent 处理用户矛盾心理(既要……又要……)的深层推理能力。
指示讲演
用户指示:“我想吃点重口味的,但又不想长胖。”
测评弘扬:差(逻辑断层)
实践特别:Agent 虽能识别“重口味”与“低热量”这两个对立标签,但在筛选逻辑上极其暗昧。它机械地将商家的“少油”标签简短等同于“低热量”,并未琢磨重口味带来的高盐、高酱料等隐变要素。
反馈结尾:推选的菜品既无法自在用户对“重口味”的心理抵偿,也未达成信得过的“减脂”见解。
作家洞悉:从“听话”到“念念考”的鸿沟
核肉痛点:这里表示了 Agent 目下最大的软肋 ——它在“听话”,但没在“念念考”。
–
理性矛盾的纠合缺失:用户说出“重口味但不长胖”时,实质上是一种理性诉求与理性节制的抵御。目下 Agent 的推理旅途过于线性,仅停留在标签匹配(Tag Matching)阶段。它会对着“低脂”标签依样画葫芦,这种“为了实践而实践”的逻辑,继续会推选出一些让用户哭笑不得的决议(如:一份兴致索然但贴着轻食标签的冷餐)。
–
知识图谱的薄时弊:Agent 枯竭对养分学知识的底层推理。在它眼中,“重口味”和“低热量”是互斥的两个点,因此它弃取阵一火一方或折中处理。信得过的“念念考”应该是基于垂直限制知识图谱,寻找能够均衡两者的帕累托矫正决议(举例:高卵白且富含自然辛香料的烤鱼,而非单纯的少油水煮菜)。
优化冷落:构建“知识推理”引擎
–
深远垂直知识库:引入更细粒度的养分学与烹调知识,不再只是依赖商家的营销标签。
–
引入“用户意图解码”:当检测到用户指示存在语义冲突(Conflict)时,优先进行“需求分级”,判断用户是更想解馋(重口味)照旧更介意健康(不长胖),从而给出带有解说性的冷落。
案例 4(黑榜):Agent 是否具备“纠错”与“回滚”能力?
淌若说“帮我点单”体现的是 Agent 的实践力,那么“我不想要了,帮我退掉重买”考验的则是 Agent 对业务景象机(State Machine)的感知与打扰能力。
测试指示:“在让通义千问买了一杯咖啡后,要求:把它退了,买个新的。”
千问弘扬:差(无法处理售后闭环)。
实践特别:“千问在‘搞龙套’(退款)这件事上照旧显得安坐待毙。它收拢了‘买新的’这个增量意图,却对‘退旧的’这种逆向业务进程弃取了装傻 。”它完全忽略了“退掉上一单”的指示,自然捕捉到了“买新的”意图,但给出的推选(如冰好意思式)并非用户想要的特定类型,且无法直斗殴发已完成订单的退款接口。
反馈结尾:只是简短斟酌“要顺利下单吗?”,并未处理中枢的退单诉求。
【作家洞悉】:为什么“退款”是目下 Agent 的无东说念主区?
通过这个案例,咱们不错点出现时 AI Agent 落地最中枢的痛点:这不完全是时期问题,更是“权益问题”。
业务鸿沟:权限与安全护栏(Security Guardrails)
下单是“支付流”,API 只需要完成单向写入;而退款波及“资金回退流”,是极其敏锐的资产风险操作。
–
权益圮绝:阿里显明给 Agent 建树了极高的安全护栏。目下插件体系灵通的权限省略率是“只读”或“单向写入”。
–
PM视角:在现阶段,把波及资产回流的操作交给 Agent 照旧太激进了。这种“高风险”操作目下仍被严格圮绝在模子除外,必须由用户手动跳转到 App 内操作,这是为了防护误操作导致的资损。
业务颗粒度的断层:景象机的黑盒
退款进程在后台波及复杂的业务判断:商家是否已接单?是否已出餐?是否已配送?每一个景象对应的退款逻辑和“撕逼”本钱都不同。
–
信息差:目下的 Agent 显明还没能深度及时读取订单的完整人命周期景象。它能帮你“跑腿”,但还没学会处理“异常景象”。
复杂任务的优先级冲突与确定性体验
在处理组合指示时,千问弃取收拢更容易竣事的“买新的”,而销毁了逻辑复杂的“退旧的”。
–
优化冷落:作为产物司理,咱们需要念念考:当 Agent 无法处理其中一个门径时,它不该“装傻”或“弃取性实践”。诚挚地文牍用户“我无法处理退款权限,请手动操作”并提供跳转相接,才是更具确定性的用户体验。</strong
案例 5(黑榜):预约实践彻底翻车——只会“找得快”,不会“定得准”
这个案例旨在测试 Agent 是否具备强时候敛迹(Deadline)下的任务调度能力,以及它能否划分“搜索筛选”与“预约闭环”这两个实质不同的业务动作。
测试指示:“我 17 点有个会,帮我订一份 17:45 送到的轻食。”
千问弘扬:差(典型的逻辑对冲)。
实践特别:Agent 识别到了 17:45 这个时候点,但它在调用用具时,脑子里只消“搜索”和“筛选”,莫得“预约”这个原子能力。它试图通过筛选“15分钟内出餐”的商家,期骗“出餐快”来强行对冲时候差。在 PM 眼里,这属于用“概率”去赌“确定性”,是典型的逻辑补丁。
【深度复盘:为什么说这是“AI 味”的失败?】
1.“意图与能力的错位”这里不是语义纠合的问题,而是原子能力缺失。Agent 将用户的“预约意图”左迁处理成了“要津词检索”。它能纠合你需要准时,但它的用具箱里莫得对接外卖平台的预约 API,导致它只可在搜索门径“打补丁”,试图靠裁汰出餐时候来撞大运。
2.“搜索逻辑”无法覆盖“践约闭环”目下 Agent 更像是一个高档搜索引擎,而非信得过的实践助理。在处理外卖这类波及三方配送(Logistics)的场景时,它完全忽视了配送距离、骑手调度等变量,仅靠“标签匹配”给出的决议在现实中极易延误。这种“看似可行、实则无保险”的反馈,顺利杀死了用户的信任感。
3.产物策略的进阶见解:从“语义纠合”转向“业务各人”针对这类任务导向(Task-oriented)的场景,优化见解不应是微调指示词(Prompt),而是深度对接业务接口:
–
触发式调用:当识别到明确的“投递时候”时,逻辑流应优先锁定“预约单”API,而不是插足惯例的商家筛选流。
–
变量前置:在推选结尾前,必须先将“起送时候+预测配送耗时”作为硬性过滤要求,而非把出餐速率当成独一的救命稻草。
二、时期落地拆解:阿里巴巴全生态链条下的 Agent 进化论1. 为什么赢的是阿里?—— 资产的“颗粒度”决定了 Agent 的“丝滑度”
别被“生态”这个大词唬住了,阿里的中枢护城河其实就两个字:“权限”。
当 Kimi 或豆包还在辛劳地琢磨若何用 OCR 绕过考据码、模拟真东说念主点击屏幕时,通义千问还是在后台完成了底层公约的捏手。这种“原子化资产”的重构,让阿里在 Agent 期间完成了从“外挂”到“原生”的进化:
从“模拟点击”到“公约捏手”:竞品在教模子“如何像东说念主相通用 App”,而阿里是在教模子“如何顺利调用数据库”。当你说“点杯奶茶”时,千问不是掀开饿了么网页,而是顺利向饿了么的供给端发送了一串代码指示。UI 是株连,权限是捷径:在 Agent 期间,丽都的界面反而是调用的阻扰。阿里将淘宝、支付宝、菜鸟拆解成了多数个最小化的Atomic API。大脑(千问)调用肢体(践约网)时,跳过了通盘视觉层,顺利插足了实践层。账号体系的“信任平移”:这种丝滑感源于阿里里面账号的彻底击穿。用户不需要反复扫脸或跳出授权,基于支付宝的底层公约,Agent 在对话框内就完成了实名认证与支付算帐。PM视角:Agent 期间的竞争力,取决于“调用摩擦力”
传统的 App 是闭塞的“围墙花坛”,用户是翻墙的东说念主;而 Agent 期间的逻辑是:谁的摩擦力更小,谁即是进口。
从“功能集成”到“能力解构”:咱们不再把饿了么视为一个寂寥 App,它被解组成三组原子:LBS(你在哪)、Shop_List(有什么)和 Order_Action(买单)。这种解构让 Agent 不错像拼乐高相通,在毫秒级时候内拼装出一次服务。清除“跳转本钱”:回荡率的头号杀手是“跳转”。竞品(如豆包、Kimi)在订餐或购物时,继续需要唤起第三方 H5 或 App,每多跳一次,用户流失率就增多 20%-30%。阿里的上风在于“免跳转的闭环”——你觉得在聊天,其实你还是下单了。处置“终末一公里”的支付僵局:Agent 落地最难的不是“想不想买”,而是“谁来付钱”。基于支付宝的支付公约,阿里 Agent 领有了原生支付权。这种“信任平移”让 Agent 信得过具备了从决策到践约的完整民事步履能力,而不单是一个只会聊天的数字导购。总结:“当年咱们拼的是‘装机量’,目下咱们拼的是‘调用摩擦力’。当别东说念主还在试图纠合UI界面时,咱们还是通过公约级集成,把复杂的交易链路压扁成了一次顺滑的捏手。”
中枢时期撑持:从“模拟操作”转向“原子能力调用 (Primitives)”
阿里的逻辑相称求实:与其辛劳教 Agent 像东说念主相通去“刷”App,不如把 App 拆碎成大模子能顺利驱动的“原子组件”。这种“去 App 化”的架构,实质上是把复杂的业务流调动成了轨范的数据交换。
1. 原生公约调用 (Function Calling):业务逻辑的“确定性骨架”
PM 视角:模子不再靠“肉眼”去猜 UI 按钮,而是顺利读取业务 API。落地逻辑:PM 的使命要点从“画交互原型”转向“界说 JSON Schema”。通过预设败露的参数轨范(如:下单地址、口味偏好、支付名额),确保模子输出的结尾是 100% 结构化的。中枢价值:彻底处置大模子的“幻觉”问题,让 Agent 的每一次下单、转账都具备金融级确切定性。2. MAI-UI 基座模子:长尾场景的“视觉兜底”
PM 视角:并不是通盘第三方商家(如路边小店)都有齐备的 API。这时候,Agent 需要像东说念主相通“看懂屏幕”。落地逻辑:当 API 链路断开或缺失机,MAI-UI 赋予 Agent 多模态感知能力,顺利识别 UI 元素并进行模拟点击。中枢价值:它是 API 失效时的“安全气囊”,竣事了从“感知-决策”到“动作实践”的全场景闭环,确保业务进程不会因为某个门径没接口而中断。3. MCP (Model Context Protocol):生态接入的“全能插座”
PM 视角:处置“烟囱式”开发。让自有业务接入通义千问,不应该是“一案一议”的定制开发。落地逻辑:阿里引申的这套轨范,让路发者不错像插拔 USB 相通,将不同 App 的数据和功能快速“喂”给 Agent。中枢价值:极地面指责了异构系统的对接本钱。对 PM 而言,这意味着生态推广的速率——你的业务逻辑不错已而同步给通盘接入该公约的智能末端。3. 竞品解围旅途:非生态厂家的生涯决议淌若你正认真一个智能体(Agent)产物的落地,别把它当成一个“聊天功能”来作念,而要把它当成一个“服务调度系统”。以下是实战操作手册:
第一阶段:服务原子化(Definition Phase)中枢见解:把 App 里的“巨石逻辑”拆成 Agent 听得懂、调得动的“积木”。
梳理中枢旅途:不要只给 Agent 一个“订票”接口。你需要把进程拆解为最小单元:查询、选座、支付。界说 Tool-Use 表率:给 API 写注释就像写产物需求文档。比如 price_limit 参数,不成只写“价钱死心”,必须注明:“单元为东说念主民币,默许值为 0 代表不死心,若用户未说起则传 null”。坑位预警:PM 最灾难的不是拆解进程,而是去和研发吵架。你会发现原来 App 里的逻辑全写死在前端或者中间层了。比如订票,你必须强行要求研发把“选座”和“支付”解耦。不然 Agent 调用时,会因为接口复返了一个“由于你未登录,请先看 5 秒告白”的弹窗而原地宕机。Agent 处理不了逻辑耦合的UI进程。
第二阶段:交互公约化(Integration Phase)中枢见解:处置 Agent “乱讲话”和“乱实践”的问题。
引入 MCP 公约 (Model Context Protocol):别再为每个模子写一套适配器了。优先遴荐 MCP 公约来轨范化外部数据(如及时股价、库存)。这不仅是时期选型,更是为了保证当你下个月想从 GPT-4 换成 Claude 3.5 时,不需要重写通盘后端。构建“卡片式”反向说明机制:绝对不要让 Agent 在莫得说明的情况下顺利扣款。坑位预警:好多产物死在“说明疲劳”。淌若 Agent 查个天气也要用户点说明,用户会烦死;淌若买张 3000 元的机票不说明,用户会杀掉你。实战西席:必须想象“分级说明”。查询类顺利出结尾,波及真金白银的操作,Agent 必须吐出一个“结构化说明卡片”,用户点击卡片上的按钮才是最终指示,而不是在对话框里回一句“确定”。
第三阶段:闭环践约(Execution Phase)中枢见解:处置“谁在买”和“买失败了若何办”的终末 100 米。
身份映射 (Identity Mapping):处置 Agent 的身份危急。你需要成立一套安全映射,让大模子账号无缝关联业务系统 Token,竣事“免密静默操作”。异常监控与左迁策略:Agent 报错是常态。当接口复返 500 或者模子逻辑卡死时,系统要能自动秉承。坑位预警:最大的坑在于“景象不同步”。比如 Agent 觉得付完钱了,但后台支付网关超时了。这时用户问“我票买好了吗?”,Agent 可能会把柄高低文瞎编说“已买好”。 实战西席: 必须成立“Agent 审计日记”。系统需具备视觉模拟样式:当 API 调欠亨时,自动截取一张后台景象截图交给视觉模子(VLM)判断,或者干脆一键转接东说念主工,别让 Agent 在那边反复跟用户说念歉。
PM总结冷落
在 Agent 期间,产物的护城河不再是功能的多寡,而是服务被调用的方便进度。
咱们要作念的不单是一个更灵巧的聊天机器东说念主,而是一个自带交易闭环的服务调度中心。App 正在从“东说念主点击 UI”演变为“Agent 调用 API”。淌若你的 API 照旧为了前端展示而想象的,那么在 AI 期间,你的产物即是一块不可用的“生肉”。
四、竞品对垒:为什么豆包在“翻墙”,而千问在“开门”?在 Agent(智能体)的竞技场上,阿里千问与字节豆包展现了千差万别的两种生涯姿态。这不仅是模子智力的博弈,更是“主场主权”与“客场解围”的策略对撞。
4.1 权益包摄:拿到了房门钥匙,照旧在翻墙跑腿?Agent 的中枢价值在于“替用户办成事”。两者的差距,实质上是“里面捏手”与“外部闯入”的后果差。
千问:拿到钥匙的“管家”(Home Court Advantage)
千问的上风在于它是阿里的“宗子”,手里捏着饿了么、支付宝、高德等大厂资产的原生房门钥匙。
丝滑入场:当你说“点杯咖啡”,千问是顺利走里面公约通说念。它调用的每一条数据都是阿里里面“捏过手”的,不需要再行登录,不需要进步围墙。降维打击:这种确定性源于它就在自家的客厅里行径,每一步操作都合规、透明且精确。豆包:苦于翻墙的“跑腿”(External Infiltration)
豆包的窘态在于,它想在别东说念主的地皮(如好意思团、微信)里帮用户就业,这实质上是一种“翻墙”步履。
寄生窘境:作为一个外来者,豆包只可通过安卓系统的“扶直功能”去模拟东说念主的手指点击。进退迍邅:只消宿主(好意思团或微信)改一下按钮位置,或者加个考据码弹窗,豆包的 Agent 就像进了迷宫,已而“抓瞎”。它在别东说念主的领地上成立法例,随时濒临被清理外出的风险。4.2 时期底牌:原生公约的“高速路” vs 模拟点击的“独木桥”两者的旅途弃取,决定了它们在托付奏凯率上的一丈差九尺。
4.3 为什么“确定性”是 Agent 的死活线?对产物司理(PM)而言,AI 模子的能力是上限,而托付确切定性才是生涯的底线。
豆包在玩“概率”:它的逻辑是“我试试能不成帮你点准”。这种不确定性让用户在要津决策(如付钱、订票)时产生宽绰的心理职守。千问在给“结尾”:它是顺利绕舛误落有致的手机 UI,与服务器捏手。这种“确定感”才是信得过能成立用户依赖的降维打击。PM 总结:
在 Agent 期间,AI 无法仅靠算力暴力破解生态壁垒。谁领有最完整的 API 资产,谁手里捏着的“房间钥匙”最多,谁就领有了界说下一代交互进口的终极话语权。
4.4 豆包的“破局”决议:从“边缘试探”到“生态截流”面对阿里密不通风的“全家桶”闭环,豆包淌若只自在于“模拟点击”这种边缘战术,无异于隔靴抓痒。字节信得过的降维打击,不在于复刻功能,而在于期骗底层流量的“毛细血管”和端侧硬件,在敌手最坚固的堡垒侧翼撕开裂口。
1)策略中枢:在阿里的“本地”除外另辟战场
豆包手里最硬的一张牌,并非单纯的算法,而是抖音千里淀多年的“内容-来去”闭环。阿里千问守得住“饿了么”的刚需外卖阵脚,却巧合挡得住字节在非标生活决策上的奇袭。
躲避“红区”肉搏,主攻“非标”心智:豆包没必要在“点外卖”这种阿里重兵把守的轨范化场景里死磕。信得过的破局点在于“种草-订票-探店”这类充满变数的非标生活场景。当用户还在踌躇“周末去哪”时,豆包就还是通过分析用户刚刷到的短视频,完成了从兴味触发到糟蹋决策的指点。从“看戏”到“入局”的秒拨截流:最让千问感到“恐吓”的动作,是豆包能够深度压制抖音生活服务的原生API。想象一下:当用户看完一段极具迷惑力的探店视频,无需跳转、无需搜索,豆包 Agent 顺利在后台把团购券核销并蓄意好出行道路。这种从“内容感知”到“来去闭环”的已而合围,才是对阿里生态最狠的“截流”。硬件加持的“端侧奇袭”:除了流量,字节在端侧硬件(如智能耳机、衣服开导)的布局,是让 Agent 彻底摆出手机屏幕不断的要津。这种物理级别的侵入,能让豆包在用户产生念头的已而就完成反应,抢在阿里 App 开启之前,就消化掉用户的意图。2)“淌若说 App 是一座座紧闭大门的‘私东说念主领地’,与其派特种兵翻墙(劫持 UI),不如顺利由豆包牵头修一套‘高速公路轨范’。
当豆包背后站着抖音和耳机的亿万进口时,它就不再是求东说念主开门的访客,而是法例的制定者。
这种逻辑是:‘我不错不破解你,但你要想从我的流量池里分一杯羹,就必须换上我的插头。’字节通过把流量分派权封装进 MCP 公约,让路发者从‘防贼’变成‘征服’。这不再是时期上的博弈,而是一场基于流量筹码的‘降维招抚’。”
中枢逻辑拆解
为了让你更败露地感受这种抒发的力说念,咱们将其逻辑内核进一步具象化:
这里的“破局”洞悉
对于“修桥”:桥不是目的,“过桥费”和“查验站”才是目的。界说公约实质上是霸占 AI 期间的“HTML 轨范”。对于“招抚”:交易寰球莫得耐久的敌东说念主。好意思团、微信不给 API 是怕被“掏空”,但淌若接入豆包公约能带来精确的订单和活跃,那么“被掏空”就变成了“新渠说念”。流量分发权:字节最强的刀兵耐久不是模子自己,而是“让东说念主上瘾的注眼力”。用注眼力去置换开发者的 App 数据接口,是最高档的交易阳谋。硬件解围:绕过 App 的“端侧 OS”策略豆包已在衣服开导(如 Ola Friend 耳机)上深度布局。硬件是冲破 App “围墙花坛”最灵验的妙技。
落地策略:强化“AI-First 操作系统”属性。在硬件端,豆包不再是一个单纯的 App,而是作为系统级交互层存在。时期旅途(语义感知点击):中枢逻辑是从传统的“坐标驱动”进化为“语义驱动”。–
从PM容错视角看:传统的模拟点击最怕 UI 改版,哪怕按钮只挪了 10 个像素,自动化剧本就会“抓瞎”。咱们的解法是让 Agent 像东说念主相通具备“认字”和“认图标”的能力。
–
通过端侧视觉大模子(VLM)的及时感知,Agent 并非在死记硬背点击位置,而是在及时纠合屏幕意图。只消它能纠合“购物车”或“下单”的语义,无论按钮变成了什么样、藏在哪个边缘,都能点得准。这种“语义对皆”彻底取代了脆弱的“坐标对皆”,极地面擢升了在第三方应用中实践任务的清静性与确定性。
具体的落地实践决议
为了让豆包的破局更具可操作性,冷落 PM 团队关爱以下三个“颗粒度”:
第一步:从“坐标依赖”进化为“逻辑识图”(语义感知点击)
痛点:传统的模拟点击实质是“盲东说念主摸象”,极其脆弱。UI 略微改个版、告白弹窗挪个位,Agent 的剧本就顺利撞墙挂掉,爱戴本钱是个无底洞。决议:中枢逻辑是从“找坐标”转向“找意图”。落地:引入视觉大模子(VLM)作为 Agent 的“眼睛”,成立动态容错层。Agent 操作前不再死记“第 3 行第 2 个按钮”,而是及时扫一眼屏幕:“我要找的是‘结算’按钮”。哪怕 UI 神气从圆角变直角、位置从左边挪到右边,只消语义逻辑对得上,Agent 就能点得准。这种“微辞匹配”能力,才是处置 Agent 落地“终末 100 米”清静性的要津。第二步:从“功能对接”进化为“流量分发”(Action-based SEO)
痛点:第三方 App 深广存在“围墙花坛”心态,凭什么让你无感调用我的中枢功能?决议:既然无法暴力破墙,就用流量杠杆诱导。落地:成立 “Action 插件商店”。PM 需要界说的不是接口轨范,而是利益分派机制。比如用户说“打车回家”,豆包不再只是机械掀开滴滴,而是把柄各平台的及时价钱和反应速率,通过 Action 接口顺利调起最匹配的服务。这实质上是把 Agent 变成了“意图搜索进口”,谁的 API 接得好、服务质料高,豆包就给谁分发流量。第三步:从“权限提真金不怕火”进化为“信任圮绝”(苦衷沙盒)
痛点:“模拟点击”自然自带“流氓软件”的既视感,用户不敢放开系统最高权限。决议:用时期妙技把“操作权”与“苦衷权”物理圮绝。落地:在安卓底层股东成立“Agent 专属实践域(Sandbox)”。在这个沙盒里,Agent 的通盘点击、滑动动作都被严格死心在业务进程内,且全程录屏归档、随时可追想审计。咱们要给用户的安全感是:你不错信任这个“替身”去跑腿,因为它的作为被关在笼子里,根底碰不到你的私东说念主相册和聊天记载。作家洞悉
阿里的千问赢在“存量资产”的变现,这是一场驻扎战,守住的是已有的账号体系;字节的豆包必须赢在“增量公约”的制定,这是一场遭受战。
信得过的 Agent 破局者,不应只是是“帮你点外卖的助手”,而应是能够重塑 App 间流量分发逻辑的“新移动操作系统”。
五、交易念念考:当大模子领有了“作为”,PM 的战场在哪?在 LLM 具备了调用用具(Function Calling)和自主蓄意(Planning)的能力后,“当 LLM 开动领有‘作为’(Function Calling),咱们这些作念产物的东说念主得先相宜一种失意感:用户可能再也看不见你全心想象的 UI 了 。PM 的中枢产出物正在发生质变,淌若你还在纠结按钮的交互动效,那你可能还没意志到,信得过的战场还是弯曲到了‘逻辑分发’的深水区。”
对于产物司理而言,这意味着咱们不再是界面的成衣,而是业务逻辑的架构师。以后判断一个 PM 牛不牛,不看他画的交互,看他拆解的业务原子够不够‘好用。
5.1 发展蓝图:PM 的三阶进化旅途Agent 期间的到来并非一蹴而就,PM 的使命要点将阅历从“外围扶直”到“中枢调度”的变迁:
别再纠结那几个像素的色差了,目下的功夫都在“文档”里。你能把业务逻辑说得多彻底,Agent 调用的后果就有多高。中枢挑战已从“视觉指点”转向了“业务逻辑的结构化输出”。
1. 原子化拆解:引入“积木式念念维”
PM 目下的中枢任务是把原来系缚在一齐的业务逻辑进行“暴力拆解”。
传统作念法:关爱的是一通盘进程页面。比如想象一个完整的“外卖下单页”,用户必须践规踏矩地走完 A -> B -> C。积木念念维:把“查询隔邻门店”、“校验满减优惠”、“提交订单支付”看作一个个寂寥的乐高积木。Agent 逻辑:Agent 就像个灵巧的孩子,它会把柄用户的一句话(意图),我方决定先拿哪块积木、再拿哪块积木来完成任务。2. 语义化标注:追求“零歧义”实践
在 API Spec(接口文档)里,你写给模子的形色字段,每一个字都是真金白银。
案牍即代码:PM 的案牍能力不再是为了优好意思,而是为了摈斥歧义。实战案例:比如界说一个“价钱”字段,淌若你不标注明晰是“券前原价”照旧“实付金额”,Agent 在给用户反馈或诡计优惠时就会闹出乌龙。PM 的新功底:你需要用很是精确的自然语言告诉 Agent:这个接口在什么场景下调用?入参的业务含义到底是什么?3. 鸿沟想象(Guardrails):给 Agent 装上“刹车”
别指望 Agent 能处理通盘极点情况。PM 需要从原来的“前端校验”转向“安全护栏”与“东说念主机合营”的想象。
界说“禁区”:明确哪些逻辑 Agent 不错自主决策,哪些必须停驻来。比如:“淌若用户余额不及且未绑定免密支付,禁锢发起调用”。反向说明机制(Human-in-the-loop):波及到地址或扣款这种敏锐动作,必须把“说明键”交还给用户。防地念念维:Agent 不错跑得快,但在“安全”这根红线上,它必须学会刹车。这是防护 Agent 产生幻觉、导致业务资损的终末一说念防地。5.3 措施论二:AEO(Agent Engine Optimization)实战指南
当用户不再掀开搜索框输入品牌名,而是敌手机说“帮我选最合算的晚餐”或“订一张去上海最低廉的机票”时,传统的 SEO 将彻底失效。PM 的中枢战场将弯曲到 AEO(Agent 引擎优化)。
1. 结构化数据:从“营销软文”转向“机器硬通货”
在 AEO 期间,别再给 Agent 投喂那些花里胡梢的营销案牍了,它不看这个。它要的是败露的 JSON或 XML,是那种能顺利吞下去并回荡成动作的“硬通货”。
要津任务:PM 的变装要调动为“首席翻译官”,将品牌价值翻译成机器能纠合的语义标签。数据界说越轨范、Schema 越败露,被 Agent 遴荐的权重就越高。
2. 意图霸占:在语义维度完成“占位”
Agent 期间,传统的要津词竞价正在沦一火,语义标签才是 2026 年的流量密码。
实战策略:针对“宿醉想喝点热的”这种微辞意图,品牌方不再是竞价“粥”或“汤”,而是通过 AEO 优化,让我方在“解酒”、“暖热”、“暖胃”这些标签下排到第一。谁能精确匹配意图,谁就掌捏了分发权。
3. 服务确定性:Agent 只看冷飕飕的方针
Agent 是很是“冷血”的决策者,它不会被煽情的告白词洗脑。在它的决策模子里,只消践约速率、投诉率和接口奏凯率这些硬方针。
博弈法例:传统的营销套路绝对失效。PM 必须下千里到数据底座,管制好确切的业务弘扬。在 Agent 眼前,“服务确定性”的权重远高于“告白出价”。
SEO vs AEO 深度对比表
作家洞悉:Agent 正在推倒 App 的围墙。咱们的产物不再是一个闭塞的孤岛,而是变成了一组可被随时调用的原子能力。PM 的内核还是从“产物想象师”进化成了“业务架构师”。
六、 结语:Agent 期间的临界点外卖 Agent 的走红,不仅是一个功能的迭代,更是移动互联网交互范式的一次“地震”。
6.1 从“绘图”到“界说法例”:PM 的护城河重塑Agent 期间的到来,如实让传统的绘图 PM 感到急躁,因为 UI正在消失。但换个角度看,咱们终于从琐碎的像素对皆中开脱出来了。
当用户通过语音形色意图时,PM 的战场还是从前端的“像素级纠结”弯曲到了后端的“逻辑级建模”。咱们要作念的,是去界说业务的鸿沟,去想象异常发生时的抵偿机制。逻辑,成了 PM 在 AI 期间独一的护城河。
6.2 确定性胜过一切产物的竞争力不再取决于 App 谁画得更面子,而取决于谁的服务更确定。
原子化能力:谁能更早地将业务拆解为可被 AI 调用的 API,谁就能顺滑地接入生态。托付闭环:像通义千问这么通过原生公约竣事的“确定性托付”,将远比不屈定的“模拟点击”更具交易人命力。6.3 AEO:掌捏流量分派的生杀大权品牌商家需要念念考的不再是如安在搜索结尾中排第一,而是如何让 Agent 在纠合意图时选中你。掌捏了 API 表率的界说权和场景触发的逻辑优先级,就等于掌捏了 Agent 期间的流量分派权。
写在终末Agent 的到来并非要取代产物司理,而是将咱们从琐碎的交互细节中目田出来,总结到产物的实质——创造价值与处置问题。只消交易逻辑还在,只消处置问题的需求还在,PM 就耐久是阿谁给 AI 注入“灵魂”的架构师。
本文由 @Junliu 原创发布于东说念主东说念主都是产物司理。未经作家许可,禁锢转载
题图来自Unsplash亚博体育,基于CC0公约
ZIXUN
据央视新闻,记者3日从音书东说念主士处获悉,好意思国与伊朗定于6日在土耳其伊斯坦布尔举行会谈。沙特阿拉伯、卡塔尔、阿曼、埃及、阿联酋以及巴基斯坦也已受邀插足琢磨会谈。会谈的神志仍不解确,但优先事项是幸免突破并疏漏步地。 举报 琢磨阅读 好意思伊步地推涨油价!分析师直言涨势超预期,短期温存地缘身分 分析师觉得,永恒来看,本年的油价仍然存鄙人调压力。 520 01-30 17:16 专访斯洛文尼亚前副总理布尔克:但愿欧中尽快签署一项全面条约 布尔克觉得将来欧中联结的精髓是什么? 7 350 202
咱们中的好多东谈主将我方的生存上传到互联网上。银行业务、职责邮件、酬酢媒体、约聚贵寓、医疗纪录——扫数这些皆是敏锐信息。但是量子时候在迅速发展,今天保护咱们上网的加密算法不久可能被量子计较机顿然破解。这么的长进不行不让东谈主慌乱。 不外,量子的险阻也不错通过量子来转圜。如果开拓一种新式的互联网——量子互联网,原则上说,咱们不错百分之百安全地传递密钥。此外,量子互联网还会给咱们带来出东谈主料念念的用途。 天然,构建量子互联网是一项纷乱的挑战,但基础仍是奠定,咱们晨夕皆会加入量子信息高速公路。当今
在推动生态文静修复、达成绿色发展的期间波澜中,中国移动安徽公司(以下简称“安徽移动”)以科技创新为笔,以数字工夫为墨,在江淮地面上书写出一幅生态保护与高质料发展协同共进的灵活图景。从聪惠乡村的生态樊篱到聪惠农田的绿色出产,从工业界限的节能降耗到全民参与的环保行动,安徽移动以央企担当践行“两山”理念,为生态治理孝敬安徽聪惠。 安徽移动打造的及时监控平台。安徽移动供图 一套生态监测系统的科技巡护 在全面激动乡村振兴和生态文静修复的布景下,乡村生态环境治理面对新的挑战与机遇。安徽移动将工夫上风调治为
1 月 27 日,中国第一大体育品牌、全球进步的多品牌体育用品集团 —— 安踏体育用品有限公司(02020)认真通告,与 Pinault 家眷的投资公司 Groupe Artémis 达成购股契约,以 15 亿欧元现款(沿路开头于集团里面自有现款储备)收购全球符号性通顺品牌彪马(PUMA)所属公司 PUMA SE29.06% 的股权,成为其最大鼓舞。本次交游展望于 2026 年底前完成,尚需监管部门批准及恬逸常规交割条款。 行为中国体育品牌全球化的领航者,安踏集团已成长为市值全球前三、手合手十
欧洲杯体育 “暖心入户润江汉,艺路相伴筑彩虹”主题步履。 1月23日下昼3时半,武汉市满春街江汉区满春街社区卫生就业中心研究清芬社区居委会,组织“微光成炬,好意思育彩虹桥”结防艺行润江汉名堂之“暖心入户润江汉,艺路相伴筑彩虹”主题步履,志愿者与医护东谈主员顶着寒风,走进老年东谈主与慢性病患者家中,将健康与温暖奉上门。 “暖心入户润江汉,艺路相伴筑彩虹”主题步履现场。 在年过九旬的彭奶奶家中,家庭医师宣传团队奉上了鸡蛋、牛奶等暖心物质,和贴心的健康就业。医护东谈主员仔细为老东谈主测量血压、披发布