RT @shao__meng: [コーディングエージェントのための新しいベンチマーク] cline-bench: @clineチームが新たにリリースした、コーディングエージェント向けのオープンソースで実世界志向のベンチマークイニシアチブです。このイニシアチブの中心的な目標は、コーディングエージェント評価の現状における2つの大きな問題点に対処することです。既存のベンチマーク(SWE-Benchなど)は、あまりにも学術的であり、信頼性に欠け、そして…
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。