吃飯時朋友問我,你覺得做ai產品中最難的一步是什麼我想了想,感覺最難的步驟是設計一套回饋與評估機制 首先,要先能定義好和差,也就是先找到獎勵函數但在這一步驟就可能難倒很多產品了 因為有很多場景下的好與壞是難建構量化指標的 回饋指標往往有兩類第一類是顯性回饋第二類是隱性回饋 顯性回饋就例如一個回复,按讚或者點踩隱性的就比如用戶的行為歸一化後的分析(比如點擊,停留時長等等) 但顯性回饋很難的地方在於這東西會成為一個約束條件他是負向的而不是正向的 例如你無法鼓勵用戶說這個東西真好因為即便用戶回饋“好” 是沒有太多正向收益的 人們回饋「不好」是保有期待,期望回饋後得以改善,但回饋好,對自己沒收益,只是給了系統以安慰和鼓勵 這就帶來一個問題,就是一個產品做到早期的合格,是依賴專家經驗而非回饋的,當他跑到60分左右後,才會慢慢有機會一點點收集顯性的正向回饋 某種程度上講,大多數ai產品在早期都依賴人工而非ai本身 然而人工也可能無法精細化描述出什麼是“好”,度量“好”並將其拆解為幾個正交的元素維度,在此基礎上評估並改進,是相對來說比較難的事情 如果這個事情做得好,ai產品的進展將變得順利許多
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。