米兰app2026世界杯IOS/Android通用手机版下载 码农连任务都不写了? Codex运行我方给我方派活

【新智元导读】从写指示,到给意见,再到只给一句意图:有东谈骨干脆让Codex我方定任务——东谈主类还能留在编程的商量层吗?
「我基本上再也不我方写/goal了。」
近日,前Anthropic成员、现MagicPath CEO的Pietro Schirano在X上甩出这句话,洽商区一刹炸开。

他的作念法是:不再手写那份/goal,而是让Codex为我方写一份,再为它派生的每个子智能体(agent)各写一份。
把一个高层意图丢给Codex,让它先给我方写一份谛视的/goal——奈何拆任务、哪些并行、临了奈何汇总,全由模子我方定。
重新到尾,东谈主类只用在最运行说出我方的意图,剩下的拆解、调整、扫尾,模子我方都能安排得清洁白白。
别小看Pietro这句话,此次他交给AI的并非是膂力,而是判断力:往时劝诱者交给AI的是「奈何写」,这一次交出去的是「写什么」。
先是写一句领导词,AI把活干了。
自后连领导词都懒得细写,只丢一句浑沌的意见,剩下奈何作念、分几步,让它我方琢磨。
到当今,索性连「意见」都不写了。
洽商区一位网友惊叹谈:
咱们大要依然参加这么一个时期:我给AI一个意见,AI把这个意见改得更好,然后我规则地假装我方一直是阿谁形势司理。
这句话刚好戳中了此次变迁的中枢。
当一个关节员连「要干什么」都不再亲手写,他在这条活水线上,到底还剩下什么?

东谈主只管给意图
任务交给agent去思
往时几年,领导词工程被捧成AI时期的硬手段。会写领导词,就好比捏住了掌握模子的短处。
再往后是元领导(meta-prompting):你不径直写指示,而是让模子帮你把指示写得更好。
而此次Codex所演示的更进一步:自生成意见(self-goal generation)。模子并非把你的话润色成更漂亮的指示,它径直接纳了「意见」自己:你给意图,它写/goal。
这套玩法的底座,是Codex本年4月底上线的/goal功能,先在Codex CLI里出现,近期在config.toml里把features.goals大开就能用。
官方把它塞进Codex CLI的0.128.0版块,默许关闭,要手动改设立文献才能大开。
劝诱者圈给它起了个混名,叫「Ralph轮回」:盘算、施行、测试、复查、迭代,一齐自转,不到意见不收手。
它与平淡对话领导词最大的不同,是goal这段笔墨会同期充任两样东西:肇始指示,和「完成审计」。
Codex每跑完一轮,就回头对照意见问我方两句:还该作念什么,是不是依然作念结束。一轮接一轮,直到任务完成、被你叫停,或者token烧到上限。
是以官方反复强调一件事:意见一定要写到Codex能判断「作念完莫得」,要幸免「优化一下」「完善一下」这种虚词。
果真给这件事定调的,是OpenAI的Codex负责东谈主Tibo(Thibault Sottiaux)。
2026世界杯中国线上平台
他在X上说,咱们造的每一个器用,都同期是给智能体用的:
Codex能检察、也能设立我方的/goal。这是元领导的泛化,用一句话轮廓等于:东谈主给意图,智能体来生成任务。
劝诱者@MikelEcheve把这套才智进一步评释为:Codex能自建/goal、为并行的智能体生成意见、自主切单干作。

Codex自述:「因为你明确要并行智能体,我就用多智能体器用」,并已「Created an agent」,右侧子智能体面板出现首个分身Gibbs。图源:Pietro Schirano @skirano演示视频

有东谈主依然用它干了18个小时
/goal的自转才智,依然有东谈主拿果真形势考证过。
有劝诱者实测:给Codex一句高层意见,把BACKLOG.md里的18个功能全部委派,然后东谈主就离开了。
约18小时后纪念,Codex依然自主完毕其中14个,每一处改革都过了测试、在CI里合并,全程没要一次东谈主工点头,连代码自审都交给了GPT子智能体。
算下来,这趟跑了约4.20好意思元。
skirano展示的,是更上头那一层:不单让Codex施行一份goal,而是让它给我方和每个子智能体各写一份goal,智能体的层级自动就长了出来。
只丢给它一句话,Codex就把该干全干了。

运行约10秒,景色变为「Creating 2 agents」,右侧子智能体已扩张为Gibbs与Leibniz两个并行分身。图源:Pietro Schirano @skirano演示视频

主智能体「Created 3 agents」,米兰app官方网站右窗子智能体Gibbs正在施行我方的专属/goal:想象一条数学化的过山车轨谈。各自一份goal,恰是这套派遣的中枢。图源:Pietro Schirano @skirano演示视频
这套派遣正在被模板化。
劝诱者Pablo Stanley把它作念成了模板,给出一套「Build [THING]+功能+格调」的领导词框架,让Codex照着自动生成goal、再孵化对应的子智能体。整套经过,东谈主只负责伊始那句话。这个模板被skirano本东谈主点赞。
在Reddit的r/codex社区,劝诱者依然用/goal作念遥远任务对都、自动生成验收尺度、侧目死轮回。
另一位劝诱者RTK(@riverkhan)走得更远。OpenAI团队前不久发了一篇讲奈何把/goal用好的著作,他径直把内部的最好现实封装成开源skill,取名Infinite Skills,仿照Superpowers的结构,每个skill等于skills目次下扁平的一份SKILL.md。
里头阿谁叫goal的skill,干的事很故情理:在你肃穆发起/goal之前,它先反过来「口试」你,把一个朦胧的意见,一句句商讨成具体、可考证的左券,再把整理好的无缺意见喂给goal样式。

https://github.com/Infinite-Labs-AI/infinite-skills
换句话说,goal样式跑得好不好,本就取决于意见写得够不够具体、能不可让Codex我方判断作念完莫得。
如今连「把意见商讨明晰」这一步,都有东谈主作念成器用替你包办了。

三家把合并件事作念了
这股潮水并非Codex独自引颈。
简直在合并个时辰窗口里,三家主流编程智能体,把「让AI我方拆任务、我方派智能体」这项功能,不谋而合地推了出来。
Anthropic的多智能体编排5月6日上线,Cursor的/orchestrate只隔一天、5月7日跟上。
再往前推到4月底,Codex早把/goal这块自治轮回这层基础底细铺好了。
三家简直是前后脚,标的却特等一致。
社区里很快有网友把它和Claude Code的CLAUDE.md放在扫数相比:雷同是让智能体读一份「写给我方看的证据」,再据此行径。
因此,它更像一个跨产物的共性标的,而非某一家的独门特质。
故情理的是细节上的采选。
Claude的coordinator最多能派20个subagent,况兼刻意截止只派一层:深度最初1,径直忽略。
这和Codex那种终止并行派生的途径,碰巧是两种心态。
这背后藏着一条更长的线。
当Codex能给我方、给一群子智能体派活,它就不再仅仅一个写代码的助手,而更像一个跑在后台的任务调整器,写代码仅仅它顺遂耀眼的一件事。
OpenAI思让智能体我方设定任务,盯着的理会是比「帮东谈主写代码」大得多的盘子。

留意token账单爆了
我方写意见、我方派agent,听上去很爽,但代价等于可能刷爆你的token账单。
任务跑得越久、越不需要东谈主盯,token就烧得越凶。
a16z的Andrew Chen,拿/goal在一个果真的eGPU加Mac劝诱驱动形势上跑了一通宵:不是教学demo,是真干活,14小时往时,第二天早上它还在鼓励。
Andrew Chen直言,这会让token用量翻一万倍。

你手动提20次、每次盯着看的会话,撑死几十万token;一个跑14小时、没东谈主宰的会话,量级悉数不是一趟事。
就连官方也在教东谈主踩刹车:提倡你在goal末尾加一句token预算,也别一上来就发/goal,先把形势跑出个雏形再说。

意见会漂
智能体可能偷懒
淆乱归淆乱,社区的臆度里,质疑声并不少:
让AI我方写意见,会不会出现意见漂移,跑着跑着就偏了?
智能体会不会偷懒,专挑省事的近路走?
这套东西,到底进不进得了果真的坐褥环境?
Reddit的r/codex里,天下把/goal主要如故用在长任务对都、生成验收尺度、幸免死轮回上:内容上,如故「东谈主得在傍边盯着」的景色。
网友nick吐槽,再让它递归派生几层,Codex的重要意见,怕是要酿成把咱们重构出局。
而Claude阿谁「只派一层」的截止也证据今天的所谓自治,更像是带着护栏的放权,离一个果真无缺的自治多智能体系统,还有很远的距离。
但果真的挪动正在发生,东谈主从盘算层后移了一步:先是不写代码,后是不写任务,如今只剩下一句话。
当Codex、Cursor、Claude集体把「界说任务」也交还给模子米兰app2026世界杯IOS/Android通用手机版下载,新的问题是现代码、任务、意图一层层交出去之后,关节员要怎样从新界说我方的变装。