智能搜索理所当然地获得了大量关注,但其价值所在以及大规模应用中同样有趣的问题在于(智能)索引创建。 也就是说,要组织好数据(标签、嵌入、聚类),以便良好的搜索过程能够找到正确的内容。 当你 ping Parallel 或 Exa 时,它们的代理能完美地返回我们代理需要的内容,这简直太神奇了。 但在此之前,他们做了大量的数据标记工作(这使得按关键词筛选成为可能),优化了嵌入代码(这又变得很酷了?),高效地进行了索引以提高速度,并创建了一个优秀的混合搜索策略。 要让内容可搜索,需要做很多繁琐的细节工作。这股“grep”本地搜索工具的新浪潮,试图减轻用户的索引负担。 我非常支持更好的搜索工具,所以如果它们能与我们的本地代码兼容,我绝对赞成。动态索引代码并在此基础上实现混合/代理搜索确实很困难,需要考虑很多细节设计,但如果它比普通的 grep/glob 好一些,那就意味着我们的代理能获得更好的上下文信息——这是一个巨大的价值权衡。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。