破解版懒人收集器是一款非常便携的收集器,可以帮助用户在任何网站上收集自己想要的网页数据,并且不需要用户有编程等其他基础,即使是小白用户也可以轻松收集。
它可以自动识别网页列表、收集字段、分页符等。
2.拦截请求
自定义屏蔽域名便于过滤站外广告,提高收集速度
3.各种数据导出
可以导出到Txt、Excel、MySQL、SQLServer、SQlite、Access、网站等
运行采集任务时,如果任务前已经采集了数据,如果采集前没有清空原始数据,新采集的数据会以追加的形式添加到本地采集数据库中,这样一些采集的数据可能会被再次采集并存储。而且,如果目标网页本身也重复数据,也可能造成数据重复,那么如何避免收集到的数据重复呢?
方法很简单。我们希望哪个字段内容不允许重复。只需单击此字段标题上的三角形符号,选中“过滤重复项”复选框,然后单击“确定”。
2.如何手动生成字段?
点击“添加字段”按钮
(2)在列表中的任意一行单击要提取的元素,例如,要提取标题和链接地址,请用鼠标左键单击标题。
(3)点击网页链接时,使用时会提示是否抓取链接地址。
如果想同时提取链接标题和链接地址,点击“是”,如果只想提取标题文本,点击“否”,这里我们点击“是”
系统会自动生成标题和链接地址字段,并将提取的字段内容显示在字段列表中。当点击底部表格字段的标题时,匹配的内容将在黄色背景的网页上突出显示。
如果标签列表中还有其他字段,点击添加字段,重复上述操作。