蓝天收集器可以帮助用户快速抓取网站数据,将所有数据存储在云端,无需本地管理,节省大量硬盘空间,支持多层次多页面的收集方式和内容发布功能。需要的用户应该快速下载。
天财集致力于网站数据的自动收集和发布。该系统采用PHP Mysql开发,可部署在云服务器中,使得数据采集方便、智能、基于云,让您随时随地在移动中工作!
数据采集
支持多级、多页、分页收集、自定义收集规则(支持正则、XPATH、JSON等。)精确匹配任何信息流,几乎可以收集所有类型的网页,并且可以智能识别大多数文章类型的页面内容
内容发布
与各种CMS建站程序无缝对接,实现免登录数据导入,支持自定义数据发布插件,或直接导入数据库,存储为Excel文件,生成API接口等。
自动化和云平台
软件实现定时定量自动采集分发,无需人工干预!内置云平台,用户可以共享下载收藏规则,发布供需信息,在社区中求助交流
可以直接在后台首页查看更新点击升级,也可以将压缩后的包上传到服务器解压覆盖!
安装软件
将下载的软件上传到您的服务器。如果根目录中有站点,建议放在子目录中。解压缩后,打开浏览器,输入您的服务器域名或ip地址(如果子目录存储在子目录中,请添加子目录的名称)进入安装界面
点击“接受”进入环境测试页面
必须确保所有参数都是正确的,否则在使用中会出现错误。点击“下一步”进入数据安装界面
填写数据库和方正配置,点击“下一步”
最后安装完成,现在可以使用蓝天收集器了!
[内容]和捕获组之间的差异:[内容]将自动转换为固定格式的捕获组:(?内容。*?)
和捕获组:(?内容[\s\S]*?),可以编写任意的正则表达式
[内容]适用于精度较低的一般匹配,捕获组适用于精度较高的匹配
默认情况下,它是单个匹配,并且可以检查“允许多个元素匹配”是否有多个匹配