我喜歡做針對性強的效能優化工作。過去幾天我一直在改進 Ghostty 中渲染線程讀取終端資料的方式(這需要佔用一個會阻塞 I/O 的鎖)。目前鎖定持有時間已經縮短了 2.4 倍。現在提交 PR 還為時過早,但已經很接近了! 這將直接影響終端文字和轉義序列的吞吐量,因為在高負載下(例如 `cat massive-file.txt`),渲染器鎖在效能分析中表現得相當明顯,佔用了總時間的 10% 以上,儘管我們目前發布版本中的關鍵區域每 ~8ms(8000 微秒,120Hz 到秒數)只有大約 20 到秒。 仔細想想,這其實有點不可思議。電腦速度真的很快。
先前的螢幕克隆版本已經針對其功能進行了最大程度的最佳化。我花了整整兩天時間來改進,卻只提升了 5%。為了達到 240% 的提升,我必須完全重寫,採用不同的方法。偉大的想法也有其局限性。有時,你需要一個新的偉大想法。
