Durante la cena, un amigo me preguntó cuál creía que era el paso más difícil en el desarrollo de productos de IA. Tras reflexionar sobre ello, llegué a la conclusión de que el paso más difícil era diseñar un mecanismo de retroalimentación y evaluación. Primero, debemos definir la suma y la diferencia, lo que implica hallar la función de recompensa. Sin embargo, este paso puede resultar complejo para muchos productos. Porque en muchos casos, es difícil construir indicadores cuantificables para distinguir entre lo bueno y lo malo. Los indicadores de retroalimentación se dividen generalmente en dos categorías: retroalimentación explícita y retroalimentación implícita. La retroalimentación explícita incluye cosas como una respuesta, un "me gusta" o un "no me gusta"; la retroalimentación implícita incluye cosas como el análisis normalizado del comportamiento del usuario (como clics, tiempo de permanencia, etc.). Sin embargo, la dificultad con la retroalimentación explícita radica en el hecho de que se convierte en una restricción negativa en lugar de positiva. Por ejemplo, no puedes animar a los usuarios a decir que este producto es genial porque, aunque den comentarios "buenos"... No hay muchos beneficios positivos. Cuando la gente da críticas negativas, se aferra a la esperanza de que estas conduzcan a una mejora. Sin embargo, las críticas constructivas no les benefician personalmente; solo brindan apoyo y motivación al sistema. Esto plantea un problema: el éxito inicial de un producto depende más de la experiencia de los expertos que de la retroalimentación. Solo después de alcanzar unos 60 puntos tendrá la oportunidad de recabar gradualmente comentarios positivos explícitos. En cierta medida, la mayoría de los productos de IA dependen de la intervención humana más que de la propia IA en sus primeras etapas. Sin embargo, incluso los humanos pueden tener dificultades para describir con precisión qué es "bueno". Medir lo "bueno" y descomponerlo en varias dimensiones de elementos ortogonales, para luego evaluarlo y mejorarlo en función de estas dimensiones, es una tarea relativamente difícil. Si esto se hace bien, el progreso de los productos de IA será mucho más fluido.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.