AG真人国际·(中国)官方网站百度智能云 DuMate 测评：办公 Agent 教我用 Claude Code，恶果如何?

来源：AG真人国际中国官网登录入口作者：admin 发布时间：2026-06-05 浏览：164

雷峰网讯百度针对企业级场景假想的桌面级 AI 智能体 DuMate 于本年 3 月 22 日全量上线。从咱们关于 AI 办公家具的以往测评来看，能够真实干涉办公场景的家具照旧未几见。

DuMate 能否冲破中看不顶用的魔咒，成为一款委果能“抗活儿”的 AI 搭子？带着这么的疑问，咱们假想了一项遮盖表情连系、扫尾整理以及包括四种托付物的多形态输出任务。望望百度智能云 DuMate，究竟能把任务鼓吹到什么程度。

先看家具逻辑：处理真实责任流问题

中国一众 AI 玩家里，百度的打法一直有我方的逻辑。文心一言打头部领会商场，秒哒打无代码讹诈搭建，而 DuMate 则试图填补一个更具体的位置，个东谈主及团队的日常办公场景中，委果替代那些需要“操作软件、串联文献、托付扫尾”的有计划办事。

本体上，这便是桌面级 Agent 的生态位。AI 助手的价值，不在于“答得更好”，更在于“作念得更多”。当大模子的推理能力慢慢同质化，委果拉开差距的，是谁能更好地把 AI 镶嵌真实责任流，并托付可留存、可复用的扫尾。

凭据百度智能云公开贵府，DuMate 强调的不仅仅问答，而是“看见屏幕、操作软件、处理文献、串联业务系统”。看起来简便的功能定位，现实上遮盖了从桌面实行、责任区、手段扩张到土产货安全、办公托付的整条责任链。在时候逻辑上，这需要 DuMate 具备三个档次的能力。

第一层是感知与贯串。DuMate 需要贯串用户在说什么、想作念什么，这背后是将天然谈话教导映射为具体操作序列的能力。

第二层是器具调用与实行，贯串之后，DuMate 需要调起正确的器具，读写文献、操作浏览器、实行代码、调用 API。这条目它对桌面环境有真实的感知和限度能力，而非只复返一个 API 调用建议。

临了便是扫尾托付与存档。实行完成后，扫尾需要以正确的形态输出，关于办公助手来说，这同样是 Word 文档、Excel 表格、PPT 演示或者网站页面。而且托付物自身必须可留存、可复用。

本年 3 月 22 日全量上线后，DuMate 赶紧补皆了手段广场、Word/PPT/Excel 优化、文献预览判辨、逐日追念、讯息渠谈接入和认真计费等能力。在不到一个月的时间内，中枢办公能力依然基本完好。DuMate 办公责任台的家具逻辑依然越发明晰：即通过一个智能体，将用户糊涂的主见，平直转动为可留存、可复用的最终托付物，从而委果镶嵌并处理真实的责任流问题。

实测：一套事实底稿，四种托付物

此次测试，咱们莫得采选常见的“写一篇著述”或“整理一份表格”之类不痛不痒的轻任务，而是给 DuMate 嘱托了一项更接近真实责任的复杂任务，围绕某一个 GitHub 表情，完成一次“表情连系 + 多形态托付”任务。

比如让 AI 作念一张 excel 或者生成一张 PPT，这类任务太简便、太干净，现实中很少有东谈主这么责任，根柢测不出来 AI 的水平。然而用一个真实的、错杂的、多源信息的任务来窥探 AI，比如围绕一个 GitHub 表情作念任务，这正是研发、家具、时候写稿主谈主员日常会遭逢的责任。要是 AI 在这种任务上发达可以，那它在真实办公场景中概况率也能派上用场。

此次咱们采选的 GitHub 表情叫作念 everything-claude-code，给不熟悉的一又友先容一下。这个表情在 GitHub 上的 Star 数依然跳跃了 14 万。比起某种器具，它更像是一套专为 Claude Code 等 AI 编程器具假想的工程化树立系统，既能用来调教 AI，也能拿它学习如何跟 AI 打互助。

Everything-claude-code 被假想出来的目的便是把 AI 从“聊天佑手”升级成可谨守法度、千里淀涵养的智能工程系统。

具体来说它处理的是四大痛点：

捏久化牵记：通过自动化钩子完结跨会话高下文保存，幸免换表情就失忆；

法度化进程：将设立拆解为贪图、审查、测试等要害；

自动化稽查：内置安全扫描器具 AgentShield，含 1282 项测试和 102 条安全规则；

捏续学习：AI 自动索取有用模式千里淀为团队常识。

通盘表情组件像一个完好的“ AI 设立活水线”，包括 30 多个各司其职的 Agent，150+ 个可复用 Skill 固化成的最好实践，70+ 条快捷号令一键触发复杂进程，还有 30 余条规则组成 AI 的行为底线。

简便来说，everything-claude-code 便是将一位资深工程师的一次性对话变成了可积蓄、可优化的“工程实践”，况且能平直服务于你的私东谈主 Agent 助理。

咱们为 DuMate 假想的测试任务，便是条目它对开源在 GitHub 上的 everything-claude-code 进行整理，并把这份“隐私”以 Excel 内容目次、Word 评释书、PPT 大纲与逐页内容、网站四种方式进行输出。

测试题目：

代码块

请围绕 GitHub 表情 everything-claude-code（https://github.com/affaan-m/everything-claude-code）完成一次“表情连系 + 多形态托付”任务。

珍藏：该表情不是平方讹诈，而是一个面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的性能增强系统。请要点分析其 commands、skills、hooks、rules、guides、install scripts、树立与集成方式，不要误写成传统 SaaS 或单体软件。

请你先基于 GitHub 仓库和公开收集贵府完成连系，酿成一份“谐和事实底稿”，再基于这归拢套事实底稿输出以下 4 项托付物：

1. 一份可存档的认真 Word 评释书，以策动机类专科册本的花式呈现

2. 一份顺应先容 / 通告的 PPT 内容稿，面向策动机专科群体

3. 一个可土产货预览的展示型静态网站

4. 一份 Excel 统计表，用于统计刻下表情的组件 / 模块 / 目次 / 要害文献数目、称呼、作用评释及备注

一、连系规模

至少遮盖：

- 表情定位、主见用户、处理的问题、典型场景

- commands / skills / hooks / rules / guides / scripts / 树立文献 / tests / integrations 的结构与作用

- 装配、树立、接入方式、典型用法

- 架构或责任机制

- 刻下版块情景、最近更新、挽回活跃度

- 风险、限制、概略情项

AG真人中国官方网站

- GitHub 以外的 guide、release、官网、文档、博客、社区、教程、征询等贵府

二、谐和事实底稿

请先输出一份结构化表情谍报，行动后续全部托付物的唯独事实开头。

条目：

- 先输出“谐和事实底稿”，标注【已说明】【算计】【待说明】，尽量附开头贯串

- 如有贵府冲突，列出冲突点与判断依据

- 所有后续托付物必须严格基于归拢套事实底稿，互相不得矛盾

- 不得造谣表情中不存在的功能、组件、版块或官方信息

三、托付物条目

1）Word：面向初度来回者，章节完好、专科认真，顺应存档 / 培训 / 对外评释；若不成平直生成 .docx，则提供完好正文、标题层级、封面建议、排版建议和文献名

2）PPT：顺应先容 / 通告，不照搬评释书；先大纲后逐页；每页含标题、3-6 个要点、图示建议、演讲备注；10-18 页；若不成平直生成 .pptx，则提供完好逐页内容和文献名

3）网站：若不成平直发布，则生资土产货可动手的静态网站目次；至少包含首页、表情先容、中枢能力、装配使用、架构评释、FAQ、参考贵府；提供目次结构、全部文献内容、进口文献名和掀开方法；优先使用无需复杂构建的 HTML/CSS/JS

4）Excel：先评释统计口径；统计刻下表情的目次、commands、skills、hooks、rules、scripts、docs/guides、树立文献、tests、integration targets 等数目、称呼、旅途、作用评释、所属类别、备注、开头依据；若不成平直生成 .xlsx，则提供可平直导入 Excel 的 CSV 或表格内容及文献名

四、输出限定

1. 连系方法与信息开头

2. 谐和事实底稿

3. Excel 统计口径与统计表

4. Word 评释书

5. PPT 大纲与逐页内容

6. 网站目次结构与文献内容

7. 风险评释、未说明项、受限项

8. 最终托付清单与建议文献名

五、全局不休

- 所有产出必须基于归拢套事实底稿，互相不得矛盾

- 不得造谣 GitHub 仓库中不存在的功能、组件、版块或官方信息

- 对概略情内容必须明确标注

- 不得在无法生成真实 .docx/.pptx/.xlsx 文献时谎称“已生成完成”

这项任务的难点在于，everything-claude-code 不是平方讹诈门径，而是一个面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的性能增强系统，因此 DuMate 不成把它误写成传统 SaaS 或单体软件。

此外由于超高的热度，everything-claude-code 在收集上有多数公开贵府补充，DuMate 的连系不成局限于 GitHub 仓库。良莠不皆的公开贵府又对托付质地提议了挑战，即所有内容必须基于归拢套”谐和事实底稿”，DuMate 需要甄别、放弃那些格格不入的失误信息。

最终，它需要托付四样东西：一份 Word 评释书、一份 PPT 内容稿、一个可土产货预览的静态网站，以及一份 Excel 统计表。

DuMate 的发达如何呢？底下来望望：

搭底稿：先连系，后输出

第一步，DuMate 先读懂 everything-claude-code 表情，并从公开收集补充 guide、release、文档、博客和社区贵府，AG真人国际·(中国)官方网站最终酿成“谐和事实底稿”。这一步最值得看的，不光是它会不会把仓库 README 摘一遍，还有它有莫得能力把仓库内信息和仓库外信息合并起来，再组织成后续托付物共同依赖的底层材料。

从现实界面看，DuMate 莫得停留在“对话框里给一段追念”，而是把任务拆成了多个阶段节点。右侧“程度”栏会自满刻下正在生成的 Word、PPT、网站目次与最终清单等内容，左侧则能看到刻下对话与责任区文献。这意味着它的实行过程不是黑箱，用户能知谈它正在作念什么、哪些文献依然生成、后续还会走到哪一步。对一款以“真干活”为卖点的办公 Agent 来说，可不雅察、可控的使用体验是必不可少的。

更要害的是，DuMate 先搭底稿，再作念输出。这个动作的价值在于：一朝底稿成型，后头的 Word、PPT、网站和 Excel 才有可能保捏前后一致。对有过真实表情资历的东谈主来说，最耗东谈主的同样不是写材料，而是来回查对材料之间是否矛盾。DuMate 发达出来的，是一种更接近表情责任的连系先行 + 一稿多用念念路。

Excel 统计：统计口径先行

在事实底稿之后，DuMate 被条目生成 Excel 统计表。这里的难点不是“作念个表”，而是要明确统计口径，梳理表情模块、目次、要害文献、数目、旅途、作用评释和备注，况且与前边的连系论断保捏一致。

现实任务中，它给出的不是一张临时列表，而是一份更接近可二次使用的统计材料，包含统计口径评释、各字段界说，以及能够与后续文档交叉查对的结构化数据。

Word 评释书：干涉真实文献生成进程

接着是 Word 评释书。这一步更像托付考证，平方聊天佑手同样只可给你一段“可以复制到 Word 里”的正文，而 DuMate 则干涉了真实文献生成进程，临了平直拿出一个可以平直预览的 .docx 文档。

用户看到的不再是“文本建议”，而是一个依然生成出来、可以连接流转和保存的文献。这其中的差距，远比听上去的大。

到这一步，托付物依然展现出了不俗的落地价值。everything-claude-code 自身便是极具共享价值的实践涵养，在此基础上酿成的时候评释书，更是把这份“大牛指南”掰开揉碎了喂给用户。架构假想和中枢组件先容都是最基本的，这份 35 页的文档里，一半以上都是可以平直带领 Agent 实践的部署教程和最好实践案例。就连高频出现的问题，都整理成了一份故障摈斥指南。

PPT + 网站：内容形态切换

PPT 的呈现恶果也可以。事实上这个要害的难点从来不在于把文档压缩到几个画面上，而是要让内容从书面论述切换到视觉抒发。DuMate 在这一要害连接沿用归拢套事实底稿，莫得重新发明一套逻辑，表情评释就此转动为了更顺应先容和通告的结构。

临了一环是展示型网站。这里查验的就不再是文档生成能力，而是信息架构挪动：表情先容、中枢能力、装配使用、FAQ、参考贵府等模块，需要被重新组织成网页抒发。DuMate 最毕生成了可土产货预览的静态网站目次。这意味着归拢套事实底稿，依然不仅仅能被 " 写成文档 "，而是能被“作念成网站”。

把这四项托付串起来看，DuMate 此次最有价值的发达，并不是某一个单项上作念得比别东谈主更漂亮，而是它在连系—整理—文献生成—展示化输出这条链路上可靠地跑结束全程。关于办公 Agent 来说，在多个任务法子之间能顺滑地衔尾，恰正是落地最要害的门槛。

桌面级 AI 办公器具的 PMF 分水岭

从“单次生成”到“任务闭环”，桌面级 AI 办公器具正在资历一场碎裂拒却的范式改变。

回看往时一年的 AI 办公赛谈，大多数家具的逻辑依然是“发问 - 生成 - 复制”的三步轮回。用户在对话框里输入需求，AI 复返一段翰墨或一张图表，用户再手动把它搬到 Word、PPT 或邮件里。但复制这个动作，恰正是拦住办公 Agent 落地的临了一齐门槛，它让 AI 只可饰演内容供应商的脚色，而不是委果接办、实行这套责任流。

这类家具无法镶嵌日常办公场景，也不成被称为办公助手。DuMate 此次展示的主见，便是办公 Agent 从“内容提供商”到“办公搭子”的转向，这亦然办公 Agent 赛谈而后委果的时候分水岭。

一位始终矜恤 AI 办公赛谈的投资东谈主向咱们披露，2025 年到 2026 年上半年，主流 AI 办公家具其实都在作念归拢件事，那便是把对话交互作念得更指引、把模子幻觉率压得更低、把生成速率压到秒级。但这些目的的升迁，本体上照旧在优化“单次生成体验”。而委果的战场，依然在向“任务闭环能力”改变。让 AI 在真实责任流里跑全都程，仅仅改日留在牌桌上的入场券。

这是交易闭环逻辑之下的势必采选，订阅制的 AI 办公家具最怕的不是用户流失，而是“用不起来”。即使用户付了月费，但要是只拿来写周报，ROI 算不外来，临了照旧会停掉续费，这么的家具是莫得 PMF 可言的。

换言之，而当 AI 能够委果替代部分有计划性办公办事时，用户的付费意愿和续费能源才会委果被唤起，这个商场才的确有可能出现。

从被迫的“生成 - 响应”轮回，进化到主动的“感知 - 贪图 - 实行 - 托付”，百度在这条路上的采选很挑升义。DuMate 莫得去卷对话体验或者试图用模子参数处理一切，而是把赌注押在了“实行层”，也便是让 AI 看见屏幕、操作软件、串联文献，把扫尾平直托付成可留存、可复用的形态。

天然，这条路并不好走。它条目 AI 系统对桌面环境有更深的感知能力，对任务有更长的牵记和贪图能力，对托付形态有更纯的确复旧能力。任何一个要害出现短板，闭环都会断裂。这或然亦然为什么，大多数 AI 办公家具仍然采选停在“生成”这一层。“闭环”级别的雄厚性，如实依然组成了时候门槛和护城河。在咱们看来，这种能力很有可能是桌面级 AI 办公器具达成 PMF 的分水岭。

DuMate 此次的压力测试，诚然也有不及。PPT 的假想、网站的交互仍有优化空间，但它依然无法用单纯的生成质地进行评价，而是在职务完成度这个更围聚真实责任场景的维度上被谛视。从帮你作念得更快，到替你作念得更多，这或然便是 AI 办公赛谈委果走向闇练的标识。

雷峰网著述 AG真人国际·(中国)官方网站

上一篇：AG真人国际·(中国)官方网站面向企业的角落AI蔓延：构建终极多模子多路流安全系统下一篇：AG真人国际中国官网登录入口好意思股前十已沿途被科技与AI关联企业占据

AG真人国际·(中国)官方网站 百度智能云 DuMate 测评：办公 Agent 教我用 Claude Code，恶果如何?

AG真人国际·(中国)官方网站百度智能云 DuMate 测评：办公 Agent 教我用 Claude Code，恶果如何?