正因如此,所有评估都应该包含以下内容: 每项任务的成本 每项任务所需时间 除了整体性能和令牌指标之外,用户也关心他们的体验,所以我们应该衡量这种体验(即使是不同的硬件)。如果一项任务完成得更便宜/更快,人们希望看到这一点。