完成人工智能查询需要几个小时,但我估计可能有 5 万个国家医疗服务提供者识别码 (NPI) 与索马里人相关。这涉及大量的医疗保健服务。 然后对该子集进行更深入的提取,以识别网站、金额、员工、诊所地址分析等等。
到目前为止,LEIE数据库中还没有索马里裔人士的姓名缩写。(处理全部75万个唯一姓名还有很长的路要走,我目前只完成了大约10%,按目前的速度,预计还能识别出5万个可能与索马里相关的姓名缩写。)这太荒谬了。 https://t.co/CN6fein01f
还在运行!由于速率限制,实际耗时大约一两天,而不是几个小时。73万个唯一名称被压缩成7.3万个查询。我计划构建管道来处理和分析部分结果,所以明天会发布部分结果。最终我预计会筛选出大约5000到1万个优先目标——我会非常谨慎地选择发布对象。即便如此,数量仍然相当庞大。