数学やプログラミングなどの複雑なタスク (human eval+、mbpp、gsm8k ベンチマーク) でトランスフォーマーのパフォーマンスを向上させる革新的なアイデアがある場合は、一晩中実験を実行し、翌朝に真実と向き合ってください。 あなたは失敗と言いますが、私は「面白い!」と言います。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
1 件のツイート · 2025/11/16 7:29
数学やプログラミングなどの複雑なタスク (human eval+、mbpp、gsm8k ベンチマーク) でトランスフォーマーのパフォーマンスを向上させる革新的なアイデアがある場合は、一晩中実験を実行し、翌朝に真実と向き合ってください。 あなたは失敗と言いますが、私は「面白い!」と言います。