X (Twitter)

Simon Willison（Django 框架的共同創辦人）。他一邊陪家人裝飾聖誕樹、看電影，一邊用Codex CLI + GPT-5.2，把Emil Stenström 的JustHTML（純Python、透過html5lib-tests）連接埠成了一個純JS、零依賴的函式庫，跑過了9200+ 個html5lib-tests ，最後產出大約9000 次使用案例。整個過程他自己只發了8 條左右的提示詞。當然我不是來吹Coding Agent 或說GPT-5.2 多牛逼的，只是正好我發現這案例本身完美命中了Coding Agent 的舒適區。什麼是Coding Agent 的舒適圈呢？ 1. 從一種語言「翻譯」到另一種語言大語言模型最擅長的事情之一就是“照葫蘆畫瓢”，或者說“翻譯”，無論是自然語言還是程式語言，都能做到又快又好。所以像這個案例中從Python 翻譯成JS，相對就很輕鬆了 2. 有完整的測試集合想想我們日常寫程式碼，寫完都需要測試一遍，如果不對再修改，如果這個過程需要人工介入，比如一些UI 測試，就會很低效，但是如果Agent 能自己測試，那麼它可以從測試中收集反饋不斷調整不斷修復，直到把問題解決。這個HTML5 標準有一套名為html5lib-tests 的測試集。這是一套與語言無關的測試資料（輸入是HTML，輸出是正確的解析樹結構）。這就好比你讓AI 做數學題，你雖然不懂解法，但你手上有一本標準答案的習題冊。你不需要盯著AI 寫的每一行程式碼（過程），你只需要看它算出的結果對不對（結果）。 3. 已經設計好了架構，Agent 只需要“填空” Agent 由於受上下文視窗長度限制，每次任務是沒辦法太長的上下文，複雜一點的專案你沒法整個程式碼庫扔過去，所以我們通常要基於架構設計將Agent 的任務拆分成小一點的任務讓它剛好在上下文視窗內完成。所以架構設計無論對於真人的專案或是Coding 的專案都非常重要。 Simon 這個專案他不需要憑空設計，直接讓Agent 參考那個Python 專案的API 設計。這意味著架構是現成的，AI 只需要基於現有架構去「翻譯」。 4. 高手來操作武俠小說裡面，同樣一把劍，在高手中能發出更大的威力，毫無疑問Simon 是高手中的高手。看Simon 的操作流程： 1). 制定規格(Spec First)：第一條提示字不是求程式碼，而是丟給AI 現有的Python 程式碼，讓它寫一份JavaScript 版本的設計文件（Spec）。 2) 冒煙測試(Smoke Test)：讓AI 先跑通一個最簡單的「Hello World」等級的HTML 解析，確保連結是通的。 3. 死循環測試(The Loop)：Simon 配置GitHub Actions，每提交一次程式碼就自動執行那9000 多個測試用例。 - AI 寫程式碼-> 跑測試-> 報錯-> AI 讀取錯誤日誌-> 修正程式碼-> 再跑測試。 - 結果：AI 像個不知疲倦的程式設計師，用了140 萬個Token，提交了43 次，直到所有綠燈亮起。 Simon 把這個過程稱為「設計智能體閉環」 (Designing the Agentic Loop)。這就是為什麼這個專案對於Agent 來說做起來很成功。 --- 既然我們知道Coding Agent 的舒適圈或強項在哪裡，其實我們在開發時也可以充分發揮它的強項，比如說： 1. 不要急著實現，先看看有沒有“葫蘆”可以照著畫“瓢” 2. 盡量讓Agent 自己去驗證需求，為Agent 提供驗證必須的工具，例如Chrome Dev Tool MCP、Lint、自動化測試等等 3. 先設計好再去實現

來自宝玉（@dotey）的推文串

作者資訊

推文串內容