k8凯发天生赢家

新闻中心 新闻中心

测完几个Agent工具,我发现他们能代打游戏了

发个指令,给点权限

作者:陈玉芸
颁布功夫:2026-06-02 06:01:17
阅读量:1527

测完几个Agent工具,我发现他们能代打游戏了

发个指令,给点权限,AI就能自己打开游戏库库玩了 。

不懂咋玩?那就截图鉴别 。没法操作?直接现搓剧本 。操作一坨?甚至还能上网自己找攻略 。

这就是此刻跑在你电脑上的 AI Agent 能做到的事儿 。

世超把市面上的一些 Agent 工具测了一遍,好比Codex,TRAE,QoderWork,Workbuddy,Marvis等等 。

只能说,这玩意儿吹了这么久,大伙儿可能真不用再张望了 。

从左向右顺次为:第一行WorkBuddy,TRAE,Marvis;第二行Codex,QoderWork,悟空

当然,一听 code 啥的,大伙儿可能感触是为专业开发者造的,门槛高,学起来用起来会很麻烦 。

诶,莫不安,大厂们也都悄摸进化一轮了 。

之前的确硬核了点,一个两个的都照搬 VS Code 那种传统的编程页面,适合开发,但并不适合和 AI 一路开发 。

VS Code页面

既然引入 Agent 了, 那注定得重新设计,终于它是来干活的,而人是监督它的 。

所以各人都很默契地改了统一套交互逻辑,把具体的代码隐去,再把 Agent 干活儿时的日志显示出来 。

在网页里你能够叫它教员,但在 Agent 工具里,你得化身老板,把活儿给摊派领略 。

咱先来看界面,也很简洁,重要三个部门 。

左边是你手底下掌管的项目,中央是通例的谈天窗口,右边就能看到期待验收的器材了 ( 通常等工作起头了才会有动静 ) 。

向左滑动,顺次为:Codex,TRAE,WorkBuddy,Qoderwork

能 BB 就不着手,咱先去 Agent 工具的 “ 利用商店 ” 里游游,看看有啥相宜的技术包,也就是 Skill,给 Agent 装上左膀右臂 。

能看到,应接不暇啊,终于活儿的种类也就那么多,所以凡是有名有姓的根基都能扒拉到现成的规划 。

什么数据分析,内容创作都不在话下,固然不至于个个都好用,但参考参考终归是能少走点弯路的 。

其中做的比力有新意的是腾讯新出的 Marvis,把技术商店做成了类似幼红书的信息流,能够边刷边珍藏技术 。

再加上技术在这些工具里是通用的,所以最近幼红书自己也上线了 Skill 商店,用起来也相当方便 。

当然,就算挑不外来也不要紧,技术商店里还有助咱选技术的技术 。

Codex 里叫 Skill Installer,WorkBuddy 里叫 Find Skills,算是将懒人式进行到底 。

左:Codex;右:WorkBuddy

至于自己造技术倒是不用急,固然能够通过 AI 一步步疏导造出来,但先射箭后画靶通常都不好使 。

好的技术往往是先自己跑通几遍,再提炼总结,会更接地气,也更贴合自己的使用场景 。

向左滑动,顺次为:WorkBuddy,TRAE

选好技术就能够起头工作了,这里在起头前必要选一下工作类型,默认的是通常款,但通常 Plan 模式更好使 。

这点还挺重要的,由于好多时辰了局不梦想不是 Agent 太笨了,而是咱自己也不知路想要什么 。

这个 Plan 就是在职务起头前先规整齐下,明确工作的条条框框 。

有什么不当就直接改了,不用比及最后才发现方向跑偏了 。

单一说一下咱要做什么,就能敲回车下发指令了 。

为了看具体流程,咱挑 3 个幸运儿来展示一下,OpenAI 的 Codex,字节的 TRAE 和 腾讯的 WorkBuddy,国内表的都拉出来溜溜 。

工作就原地 TP,让它们仨锐评它们仨 。

此时就能发现 Plan 的益处了,好比执行工作前,Codex 和 TRAE 都向我二次确认了下 WorkBuddy 具体是哪一个,由于国表有同名的利用,容易混合 。

当然,由于都是默认的模型,速杜仔快有慢,但就汇报了局来看,的确各有 “ 特点 ” 呐 。

先说 WorkBuddy,给到一个厚道人,上来也没问我汇报是个啥大局,吭哧吭哧就是干 。

最后给的网页,就成效来看,还是不错的,排版和内容固然 AI 味路重了点,但花里胡哨的切合咱锐评的主基调 。

并且调研后的结论相当低调,把自己放在了靠后的地位,喷起自己绝不手软,实诚这一块儿到位了 。

再来看 TRAE ,给到一幼我上人,活儿干的比力详细,不论是前期的弹出式的表单规划,还是中央的调研,思路都很清澈,子 Agent 的挪用也是相当纯熟了 。

主题结论里,固然把自己排到了老迈,但考量了 6 个维度,总分是加权出来的,也算是有理有据了 。

最后的 Codex,根基就是目前这个领域的标杆了,汇报里先来一手信源分析,就跟大伙儿拉开了点距离,下面的评价也能显著感触到更深刻一些,结合了官方产品文档的内容 。

模型好的确有优势,但思考到国内用起来不方便,暂且给到一个半夯吧 。

接下来,工作持续,让他们把各自的汇报天生一份可视化的落地页 。

你可能会说这活儿在网页里也能做,并且还更快 。

倒也没错,但分歧的点在于,这里你不必要把代码再复造粘贴到本地了,并且最重要的,Agent 会自己挪用工具,去查抄制品有没有 BUG 。

好比同样的工作,交给网页的 Gemini,这家伙甩给我几百行代码,我粘到本地打开,发现一片空缺 。 。 。

而这些 Agent 会在交付之前就预防这种情况 。

WorkBuddy 是自己挪用了 3 次预览,做了 2 次优化,才把网页交给我 。

TRAE 直接一些,直接打开了内置的浏览器,通过分歧角度的截图鉴别,打不开就刷新重试,直到确认渲染成效切合预期 。

Codex 也一样, 权限不够,总是截不着网页,试了 N 次才确认好成效 。

所以落地页的成效倒是其次,重点是这套工作执行的逻辑,是跟网页端应酬交差齐全分歧的打法 。

出格是截图反馈的工具挪用,相当于给电脑安了个赛博义眼 。

而像 Codex 这种更进一步,有 Computer Use 职能,能够全局截图反馈,而后操作 。相当于你电脑上的软件,它都能打开,等模型能力更猛了,代打几局 LOL 也不是不成能 。

当然,除了技术 skill,这些 Agent 工具还能接入其他利用,像是 GitHub,邮箱,网盘等 。

更妙的是接入一些通讯软件,像微信,飞书,这也是龙虾当初火起来的一大原因 。

接入后就能双向链接,甭管是从 Agent 往飞书发文档,还是从微信号令 Agent 往工位高低载资料,都没问题 。

像是之前远程软件的升级版,加了个 Agent 当管家,助你 24 幼时盯着自己的电脑,随叫随到 。

或者有一些按时的工作,也能找到 “ 自动化 ” 这种类型的入口,让它收受每天单调反复的流程性工作 。

向左滑动,顺次为:Codex,TRAE,WorkBuddy,Marvis

说了这么多,其实无论是什么伎俩,装什么插件,性质上都是在约束,节造着 Agent 朝咱预约的方向产出器材 。

有大佬精心优化的工作流,有厂商调教好的影象系统,也有方便实用的技术包 。

用专业点的话说这些都是 “ Harness ”,原意是给马套上马具,放这儿也是极度贴切了 。

无论马具下面的模型是哪一匹,这些 Agent 工具都得随套随用 。

就用起来的体感而言,Codex 是比力夯的,模型给力,额度还偶然重造,固然必要一点伎俩,但比起 Claude 要单一得多,适合想履历顶尖机能的折腾党 。

要是不想麻烦,直接用国内大厂的规划也行,嫌默认的模型笨,就去买点 DeepSeek 的 API 接上,也是妥妥的性价比平替 。

至于平替里面选哪一个就取决于你的使用场景了,微信和 WorkBuddy 拆伙方便,飞书和 TRAE 集成更深,钉钉何处就是 Qoder 以及咱没测到的悟空了,不外逻辑都是一样的 。

但话说回来,Agent 工具也是出弊端的,就是上的伎俩越多,破费的模型 Token 也越多,动不动几极度钟的长线工作,账单会变得贼拉长 。

所以有什么便宜管鼓的模型套餐,大伙儿就各显神通吧 。 。 。

而要是不太繁琐的活儿,这些 Agent 工具也有免费的额度,白嫖一下试试咸淡总是不亏的 。

撰文:风华

编纂:江江 & 面线

美编:焕妍

图片、资料起源:

Codex, TRAE, WorkBuddy, Marvis,QoderWork,悟空

 

文章点评

未查问到任何数据!

颁发评论

◎迎接参加会商,请在这里颁发您的见解、互换您的概想 。

最新文章

热点文章

随机推荐

【网站地图】