此节视频概要:
发布:
1.项目管理器读入网址,标记为已发 防止重复发布,循环中同理
采集:
1.项目管理器读入网址采集其中详细内容,采集并update 信息,防止重复采集。还有脚本的循环中读入同理
2.重复采集一个网站时,比如采集其中的网址信息的时候,已经入库的信息不再入库:(两种方式:1.设置列为unique,2.设置从数据库查询数据,如果有这个数据就不再入库)
3.关键词采集,已采集的关键词不再采集。两种情况(1.关键词放在数据库中,标记为已发 2.关键词放在文本中,使用exe中的批量查询。)