AG真人国际·(中国)官方网站 百度智能云 DuMate 测评:办公 Agent 教我用 Claude Code,恶果如何?

来源:AG真人国际中国官网登录入口 作者: 发布时间: 浏览:164

雷峰网讯 百度针对企业级场景假想的桌面级 AI 智能体 DuMate 于本年 3 月 22 日全量上线。从咱们关于 AI 办公家具的以往测评来看,能够真实干涉办公场景的家具照旧未几见。

DuMate 能否冲破中看不顶用的魔咒,成为一款委果能“抗活儿”的 AI 搭子?带着这么的疑问,咱们假想了一项遮盖表情连系、扫尾整理以及包括四种托付物的多形态输出任务。望望百度智能云 DuMate,究竟能把任务鼓吹到什么程度。

先看家具逻辑:处理真实责任流问题

中国一众 AI 玩家里,百度的打法一直有我方的逻辑。文心一言打头部领会商场,秒哒打无代码讹诈搭建,而 DuMate 则试图填补一个更具体的位置,个东谈主及团队的日常办公场景中,委果替代那些需要“操作软件、串联文献、托付扫尾”的有计划办事。

本体上,这便是桌面级 Agent 的生态位。AI 助手的价值,不在于“答得更好”,更在于“作念得更多”。当大模子的推理能力慢慢同质化,委果拉开差距的,是谁能更好地把 AI 镶嵌真实责任流,并托付可留存、可复用的扫尾。

凭据百度智能云公开贵府,DuMate 强调的不仅仅问答,而是“看见屏幕、操作软件、处理文献、串联业务系统”。看起来简便的功能定位,现实上遮盖了从桌面实行、责任区、手段扩张到土产货安全、办公托付的整条责任链。在时候逻辑上,这需要 DuMate 具备三个档次的能力。

第一层是感知与贯串。DuMate 需要贯串用户在说什么、想作念什么,这背后是将天然谈话教导映射为具体操作序列的能力。

第二层是器具调用与实行,贯串之后,DuMate 需要调起正确的器具,读写文献、操作浏览器、实行代码、调用 API。这条目它对桌面环境有真实的感知和限度能力,而非只复返一个 API 调用建议。

临了便是扫尾托付与存档。实行完成后,扫尾需要以正确的形态输出,关于办公助手来说,这同样是 Word 文档、Excel 表格、PPT 演示或者网站页面。而且托付物自身必须可留存、可复用。

本年 3 月 22 日全量上线后,DuMate 赶紧补皆了手段广场、Word/PPT/Excel 优化、文献预览判辨、逐日追念、讯息渠谈接入和认真计费等能力。在不到一个月的时间内,中枢办公能力依然基本完好。DuMate 办公责任台的家具逻辑依然越发明晰:即通过一个智能体,将用户糊涂的主见,平直转动为可留存、可复用的最终托付物,从而委果镶嵌并处理真实的责任流问题。

实测:一套事实底稿,四种托付物

此次测试,咱们莫得采选常见的“写一篇著述”或“整理一份表格”之类不痛不痒的轻任务,而是给 DuMate 嘱托了一项更接近真实责任的复杂任务,围绕某一个 GitHub 表情,完成一次“表情连系 + 多形态托付”任务。

比如让 AI 作念一张 excel 或者生成一张 PPT,这类任务太简便、太干净,现实中很少有东谈主这么责任,根柢测不出来 AI 的水平。然而用一个真实的、错杂的、多源信息的任务来窥探 AI,比如围绕一个 GitHub 表情作念任务,这正是研发、家具、时候写稿主谈主员日常会遭逢的责任。要是 AI 在这种任务上发达可以,那它在真实办公场景中概况率也能派上用场。

此次咱们采选的 GitHub 表情叫作念 everything-claude-code,给不熟悉的一又友先容一下。这个表情在 GitHub 上的 Star 数依然跳跃了 14 万。比起某种器具,它更像是一套专为 Claude Code 等 AI 编程器具假想的工程化树立系统,既能用来调教 AI,也能拿它学习如何跟 AI 打互助。

Everything-claude-code 被假想出来的目的便是把 AI 从“聊天佑手”升级成可谨守法度、千里淀涵养的智能工程系统。

具体来说它处理的是四大痛点:

捏久化牵记:通过自动化钩子完结跨会话高下文保存,幸免换表情就失忆;

法度化进程:将设立拆解为贪图、审查、测试等要害;

自动化稽查:内置安全扫描器具 AgentShield,含 1282 项测试和 102 条安全规则;

捏续学习:AI 自动索取有用模式千里淀为团队常识。

通盘表情组件像一个完好的“ AI 设立活水线”,包括 30 多个各司其职的 Agent,150+ 个可复用 Skill 固化成的最好实践,70+ 条快捷号令一键触发复杂进程,还有 30 余条规则组成 AI 的行为底线。

简便来说,everything-claude-code 便是将一位资深工程师的一次性对话变成了可积蓄、可优化的“工程实践”,况且能平直服务于你的私东谈主 Agent 助理。

咱们为 DuMate 假想的测试任务,便是条目它对开源在 GitHub 上的 everything-claude-code 进行整理,并把这份“隐私”以 Excel 内容目次、Word 评释书、PPT 大纲与逐页内容、网站四种方式进行输出。

测试题目:

代码块

请围绕 GitHub 表情 everything-claude-code(https://github.com/affaan-m/everything-claude-code)完成一次“表情连系 + 多形态托付”任务。

珍藏:该表情不是平方讹诈,而是一个面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的性能增强系统。请要点分析其 commands、skills、hooks、rules、guides、install scripts、树立与集成方式,不要误写成传统 SaaS 或单体软件。

请你先基于 GitHub 仓库和公开收集贵府完成连系,酿成一份“谐和事实底稿”,再基于这归拢套事实底稿输出以下 4 项托付物:

1. 一份可存档的认真 Word 评释书 , 以策动机类专科册本的花式呈现

2. 一份顺应先容 / 通告的 PPT 内容稿,面向策动机专科群体

3. 一个可土产货预览的展示型静态网站

4. 一份 Excel 统计表,用于统计刻下表情的组件 / 模块 / 目次 / 要害文献数目、称呼、作用评释及备注

一、连系规模

至少遮盖:

- 表情定位、主见用户、处理的问题、典型场景

- commands / skills / hooks / rules / guides / scripts / 树立文献 / tests / integrations 的结构与作用

- 装配、树立、接入方式、典型用法

- 架构或责任机制

- 刻下版块情景、最近更新、挽回活跃度

- 风险、限制、概略情项

AG真人中国官方网站

- GitHub 以外的 guide、release、官网、文档、博客、社区、教程、征询等贵府

二、谐和事实底稿

请先输出一份结构化表情谍报,行动后续全部托付物的唯独事实开头。

条目:

- 先输出“谐和事实底稿”,标注【已说明】【算计】【待说明】,尽量附开头贯串

- 如有贵府冲突,列出冲突点与判断依据

- 所有后续托付物必须严格基于归拢套事实底稿,互相不得矛盾

- 不得造谣表情中不存在的功能、组件、版块或官方信息

三、托付物条目

1)Word:面向初度来回者,章节完好、专科认真,顺应存档 / 培训 / 对外评释;若不成平直生成 .docx,则提供完好正文、标题层级、封面建议、排版建议和文献名

2)PPT:顺应先容 / 通告,不照搬评释书;先大纲后逐页;每页含标题、3-6 个要点、图示建议、演讲备注;10-18 页;若不成平直生成 .pptx,则提供完好逐页内容和文献名

3)网站:若不成平直发布,则生资土产货可动手的静态网站目次;至少包含首页、表情先容、中枢能力、装配使用、架构评释、FAQ、参考贵府;提供目次结构、全部文献内容、进口文献名和掀开方法;优先使用无需复杂构建的 HTML/CSS/JS

4)Excel:先评释统计口径;统计刻下表情的目次、commands、skills、hooks、rules、scripts、docs/guides、树立文献、tests、integration targets 等数目、称呼、旅途、作用评释、所属类别、备注、开头依据;若不成平直生成 .xlsx,则提供可平直导入 Excel 的 CSV 或表格内容及文献名

四、输出限定

1. 连系方法与信息开头

2. 谐和事实底稿

3. Excel 统计口径与统计表

4. Word 评释书

5. PPT 大纲与逐页内容

6. 网站目次结构与文献内容

7. 风险评释、未说明项、受限项

8. 最终托付清单与建议文献名

五、全局不休

- 所有产出必须基于归拢套事实底稿,互相不得矛盾

- 不得造谣 GitHub 仓库中不存在的功能、组件、版块或官方信息

- 对概略情内容必须明确标注

- 不得在无法生成真实 .docx/.pptx/.xlsx 文献时谎称“已生成完成”

这项任务的难点在于,everything-claude-code 不是平方讹诈门径,而是一个面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的性能增强系统,因此 DuMate 不成把它误写成传统 SaaS 或单体软件。

此外由于超高的热度,everything-claude-code 在收集上有多数公开贵府补充,DuMate 的连系不成局限于 GitHub 仓库。良莠不皆的公开贵府又对托付质地提议了挑战,即所有内容必须基于归拢套”谐和事实底稿”,DuMate 需要甄别、放弃那些格格不入的失误信息。

最终,它需要托付四样东西:一份 Word 评释书、一份 PPT 内容稿、一个可土产货预览的静态网站,以及一份 Excel 统计表。

DuMate 的发达如何呢?底下来望望:

搭底稿:先连系,后输出

第一步,DuMate 先读懂 everything-claude-code 表情,并从公开收集补充 guide、release、文档、博客和社区贵府,AG真人国际·(中国)官方网站最终酿成“谐和事实底稿”。这一步最值得看的,不光是它会不会把仓库 README 摘一遍,还有它有莫得能力把仓库内信息和仓库外信息合并起来,再组织成后续托付物共同依赖的底层材料。

从现实界面看,DuMate 莫得停留在“对话框里给一段追念”,而是把任务拆成了多个阶段节点。右侧“程度”栏会自满刻下正在生成的 Word、PPT、网站目次与最终清单等内容,左侧则能看到刻下对话与责任区文献。这意味着它的实行过程不是黑箱,用户能知谈它正在作念什么、哪些文献依然生成、后续还会走到哪一步。对一款以“真干活”为卖点的办公 Agent 来说,可不雅察、可控的使用体验是必不可少的。

更要害的是,DuMate 先搭底稿,再作念输出。这个动作的价值在于:一朝底稿成型,后头的 Word、PPT、网站和 Excel 才有可能保捏前后一致。对有过真实表情资历的东谈主来说,最耗东谈主的同样不是写材料,而是来回查对材料之间是否矛盾。DuMate 发达出来的,是一种更接近表情责任的连系先行 + 一稿多用念念路。

Excel 统计:统计口径先行

在事实底稿之后,DuMate 被条目生成 Excel 统计表。这里的难点不是“作念个表”,而是要明确统计口径,梳理表情模块、目次、要害文献、数目、旅途、作用评释和备注,况且与前边的连系论断保捏一致。

现实任务中,它给出的不是一张临时列表,而是一份更接近可二次使用的统计材料,包含统计口径评释、各字段界说,以及能够与后续文档交叉查对的结构化数据。

Word 评释书:干涉真实文献生成进程

接着是 Word 评释书。这一步更像托付考证,平方聊天佑手同样只可给你一段“可以复制到 Word 里”的正文,而 DuMate 则干涉了真实文献生成进程,临了平直拿出一个可以平直预览的 .docx 文档。

用户看到的不再是“文本建议”,而是一个依然生成出来、可以连接流转和保存的文献。这其中的差距,远比听上去的大。

到这一步,托付物依然展现出了不俗的落地价值。everything-claude-code 自身便是极具共享价值的实践涵养,在此基础上酿成的时候评释书,更是把这份“大牛指南”掰开揉碎了喂给用户。架构假想和中枢组件先容都是最基本的,这份 35 页的文档里,一半以上都是可以平直带领 Agent 实践的部署教程和最好实践案例。就连高频出现的问题,都整理成了一份故障摈斥指南。

PPT + 网站:内容形态切换

PPT 的呈现恶果也可以。事实上这个要害的难点从来不在于把文档压缩到几个画面上,而是要让内容从书面论述切换到视觉抒发。DuMate 在这一要害连接沿用归拢套事实底稿,莫得重新发明一套逻辑,表情评释就此转动为了更顺应先容和通告的结构。

临了一环是展示型网站。这里查验的就不再是文档生成能力,而是信息架构挪动:表情先容、中枢能力、装配使用、FAQ、参考贵府等模块,需要被重新组织成网页抒发。DuMate 最毕生成了可土产货预览的静态网站目次。这意味着归拢套事实底稿,依然不仅仅能被 " 写成文档 ",而是能被“作念成网站”。

把这四项托付串起来看,DuMate 此次最有价值的发达,并不是某一个单项上作念得比别东谈主更漂亮,而是它在连系—整理—文献生成—展示化输出这条链路上可靠地跑结束全程。关于办公 Agent 来说,在多个任务法子之间能顺滑地衔尾,恰正是落地最要害的门槛。

桌面级 AI 办公器具的 PMF 分水岭

从“单次生成”到“任务闭环”,桌面级 AI 办公器具正在资历一场碎裂拒却的范式改变。

回看往时一年的 AI 办公赛谈,大多数家具的逻辑依然是“发问 - 生成 - 复制”的三步轮回。用户在对话框里输入需求,AI 复返一段翰墨或一张图表,用户再手动把它搬到 Word、PPT 或邮件里。但复制这个动作,恰正是拦住办公 Agent 落地的临了一齐门槛,它让 AI 只可饰演内容供应商的脚色,而不是委果接办、实行这套责任流。

这类家具无法镶嵌日常办公场景,也不成被称为办公助手。DuMate 此次展示的主见,便是办公 Agent 从“内容提供商”到“办公搭子”的转向,这亦然办公 Agent 赛谈而后委果的时候分水岭。

一位始终矜恤 AI 办公赛谈的投资东谈主向咱们披露,2025 年到 2026 年上半年,主流 AI 办公家具其实都在作念归拢件事,那便是把对话交互作念得更指引、把模子幻觉率压得更低、把生成速率压到秒级。但这些目的的升迁,本体上照旧在优化“单次生成体验”。而委果的战场,依然在向“任务闭环能力”改变。让 AI 在真实责任流里跑全都程,仅仅改日留在牌桌上的入场券。

这是交易闭环逻辑之下的势必采选,订阅制的 AI 办公家具最怕的不是用户流失,而是“用不起来”。即使用户付了月费,但要是只拿来写周报,ROI 算不外来,临了照旧会停掉续费,这么的家具是莫得 PMF 可言的。

换言之,而当 AI 能够委果替代部分有计划性办公办事时,用户的付费意愿和续费能源才会委果被唤起,这个商场才的确有可能出现。

从被迫的“生成 - 响应”轮回,进化到主动的“感知 - 贪图 - 实行 - 托付”,百度在这条路上的采选很挑升义。DuMate 莫得去卷对话体验或者试图用模子参数处理一切,而是把赌注押在了“实行层”,也便是让 AI 看见屏幕、操作软件、串联文献,把扫尾平直托付成可留存、可复用的形态。

天然,这条路并不好走。它条目 AI 系统对桌面环境有更深的感知能力,对任务有更长的牵记和贪图能力,对托付形态有更纯的确复旧能力。任何一个要害出现短板,闭环都会断裂。这或然亦然为什么,大多数 AI 办公家具仍然采选停在“生成”这一层。“闭环”级别的雄厚性,如实依然组成了时候门槛和护城河。在咱们看来,这种能力很有可能是桌面级 AI 办公器具达成 PMF 的 分水岭。

DuMate 此次的压力测试,诚然也有不及。PPT 的假想、网站的交互仍有优化空间,但它依然无法用单纯的生成质地进行评价,而是在职务完成度这个更围聚真实责任场景的维度上被谛视。从帮你作念得更快,到替你作念得更多,这或然便是 AI 办公赛谈委果走向闇练的标识。

雷峰网著述 AG真人国际·(中国)官方网站