Simon Willison(Django 框架的共同創辦人)。他一邊陪家人裝飾聖誕樹、看電影,一邊用Codex CLI + GPT-5.2,把Emil Stenström 的JustHTML(純Python、透過html5lib-tests)連接埠成了一個純JS、零依賴的函式庫,跑過了9200+ 個html5lib-tests ,最後產出大約9000 次使用案例。 整個過程他自己只發了8 條左右的提示詞。 當然我不是來吹Coding Agent 或說GPT-5.2 多牛逼的,只是正好我發現這案例本身完美命中了Coding Agent 的舒適區。 什麼是Coding Agent 的舒適圈呢? 1. 從一種語言「翻譯」到另一種語言 大語言模型最擅長的事情之一就是“照葫蘆畫瓢”,或者說“翻譯”,無論是自然語言還是程式語言,都能做到又快又好。 所以像這個案例中從Python 翻譯成JS,相對就很輕鬆了 2. 有完整的測試集合 想想我們日常寫程式碼,寫完都需要測試一遍,如果不對再修改,如果這個過程需要人工介入,比如一些UI 測試,就會很低效,但是如果Agent 能自己測試,那麼它可以從測試中收集反饋不斷調整不斷修復,直到把問題解決。 這個HTML5 標準有一套名為html5lib-tests 的測試集。這是一套與語言無關的測試資料(輸入是HTML,輸出是正確的解析樹結構)。 這就好比你讓AI 做數學題,你雖然不懂解法,但你手上有一本標準答案的習題冊。你不需要盯著AI 寫的每一行程式碼(過程),你只需要看它算出的結果對不對(結果)。 3. 已經設計好了架構,Agent 只需要“填空” Agent 由於受上下文視窗長度限制,每次任務是沒辦法太長的上下文,複雜一點的專案你沒法整個程式碼庫扔過去,所以我們通常要基於架構設計將Agent 的任務拆分成小一點的任務讓它剛好在上下文視窗內完成。 所以架構設計無論對於真人的專案或是Coding 的專案都非常重要。 Simon 這個專案他不需要憑空設計,直接讓Agent 參考那個Python 專案的API 設計。這意味著架構是現成的,AI 只需要基於現有架構去「翻譯」。 4. 高手來操作 武俠小說裡面,同樣一把劍,在高手中能發出更大的威力,毫無疑問Simon 是高手中的高手。 看Simon 的操作流程: 1). 制定規格(Spec First): 第一條提示字不是求程式碼,而是丟給AI 現有的Python 程式碼,讓它寫一份JavaScript 版本的設計文件(Spec)。 2) 冒煙測試(Smoke Test): 讓AI 先跑通一個最簡單的「Hello World」等級的HTML 解析,確保連結是通的。 3. 死循環測試(The Loop):Simon 配置GitHub Actions,每提交一次程式碼就自動執行那9000 多個測試用例。 - AI 寫程式碼-> 跑測試-> 報錯-> AI 讀取錯誤日誌-> 修正程式碼-> 再跑測試。 - 結果:AI 像個不知疲倦的程式設計師,用了140 萬個Token,提交了43 次,直到所有綠燈亮起。 Simon 把這個過程稱為「設計智能體閉環」 (Designing the Agentic Loop)。 這就是為什麼這個專案對於Agent 來說做起來很成功。 --- 既然我們知道Coding Agent 的舒適圈或強項在哪裡,其實我們在開發時也可以充分發揮它的強項,比如說: 1. 不要急著實現,先看看有沒有“葫蘆”可以照著畫“瓢” 2. 盡量讓Agent 自己去驗證需求,為Agent 提供驗證必須的工具,例如Chrome Dev Tool MCP、Lint、自動化測試等等 3. 先設計好再去實現
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
