火车采集器(LocoySpider)v9.12.20200106免费版
火车采集器(LocoySpider)v9.12.20200106免费版
大小:30.1M
语言:简体
分类:下载工具
平台:WinAll,
下载
软件简介

火车采集器(LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软件,通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。

火车采集器(LocoySpider)

  程序支持远程下载图片文件,支持网站登陆后的信息获取,支持探测文件真实地址,支持代理,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等许多功能特点。

  火车采集器支持从任何类型的网站采集获取您所需要的信息,如各种新闻类网站、论坛、电子商务网站、求职招聘网站等。

  同时具有强大的网站登录采集、多页和分页的采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等高级采集功能。

  强大的php和c#插件支持,让您可以通过二次开发实现您所想要的任何更强大的功能。

软件特色

  1、通用性强

  无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所需要的内容。

  2、稳定、高效

  五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少。

  3、扩展性强、适用范围广

  自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程接口处理数据,让数据都能为你所用。

菜单功能

火车采集器v9破解版

  1.新建分组

  新建一个任务分组,选择所属分组,确定分组名称和备注。

  2.新建任务

  确定所属分组,新建一个任务,填写任务名称并保存。

  3.Web发布配置

  Web发布配置定义了如何登陆一个网站以及向该网站提交数据。

  主要涉及到登录信息的获取,网站编码设定,栏目列表的获取,以及使用数据测试发布效果。

火车采集器(LocoySpider)

  4.Web发布模块

  可以定义网站登录,获取栏目列表,获取网页随机值,内容发布参数,以及上传文件,构造发布数据等高级功能。

火车采集器v9破解版

  5.数据库发布配置

  数据库发布配置定义了数据库链接信息的设置以及数据库模块的选择。

  6.数据库发布模块

  用于编辑数据库的发布模块,方便我们将数据发布到配置好的数据库中。

  火车采集器可选mysql、sqlserver、oracle、access四种数据库类型,在文本输入框中填写sql语句

  (需有数据库相关知识),并可使用标签替换相应数据。也可在采集器模块文件夹中加载某一模块进行编辑。

火车采集器(LocoySpider)

  7.计划任务

  设置列表中采集任务的启动计划,可每间隔、每天、每周、仅一次、或自定义Cron表达式,

  (Cron表达式的写法可参考相关术语中的介绍)。保存设置后,任务即可按照设置执行。

火车采集器v9破解版

  8.插件管理

  插件是可以用来扩展火车采集器功能的程序

  火车采集器V9支持PHP源码、C#源码、C#类库三种类型的插件,

  可用于扩展http请求、内容处理和文件下载的功能,并可以分别进行测试。

  9.http二级代理

  网络中的服务器,可以让网络用户去取得所需要的网络信息。

  代理的功能有可以突破自身ip的访问限制访问国外站点,访问一些单位或团体内部资源,

  突破电信的ip封锁和隐藏真实的ip等。

  火车采集器V9支持http代理、socket4和socket5代理。

火车采集器(LocoySpider)

  10.http模拟请求

  可以设置如何发起一个http请求,包括设置请求信息,返回头信息。并具有自动提交的功能。

基本功能

  1、规则自定义-通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。

  2、多任务,多线程-可以同时进行多个信息获取任务,每个任务可以使用多个线程。

  3、所见即所得-任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。

  4、数据保存-数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。

  5、断点续采-信息收集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。

  6、网站登录-支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。

  7、计划任务-通过这个功能可以让你的采集任务定时、定量或者一直循环执行。

  8、采集范围限制-可以根据采集的深度和网址的标识来限制采集的范围。

  9、文件下载-可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。

  10、结果替换-可以将采集的结果根据规则替换成你定义的内容。

  11、条件保存-可以根据某个条件来决定那些信息保存,那些信息过滤。

  12、过滤重复内容-软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容。

  13、特殊链接识别-运用此功能可以将用JavaScript动态生成的链接或其他更古怪的连接识别出来。

  14、数据发布-可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的目标发布媒体包括:数据库(access,sqlserver,mysql,oracle),静态htm文件。

  15、预留编程接口-定义多个编程接口,用户可以在事件中利用PHP,C#语言进行编程,扩充采集功能。

特色功能

  1、支持所有网站编码:完美支持采集所有编码格式的网页,程序还可以自动识别网页编码。

  2、多种发布方式:支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合。

  3、全自动:无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预。

  4、本地编辑:本地可视化编辑已采集的数据。

  5、采集测试:这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布。

  6、管理方便:使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。

更新日志

  1:二级代理页面、功能全面优化调整。

  2:修复SqlServer数据库下载图片记录错误的问题。

采集

小说采集

爬虫软件

数据采集

相关软件
百思不得姐短视频批量下载v1.0绿色版
百思不得姐短视频批量下载v1.0绿色版
下载
美图录下载器v1.0绿色版
美图录下载器v1.0绿色版
下载
PDown下载器v4.3.6绿色免费版
PDown下载器v4.3.6绿色免费版
下载
zblog采集软件v1.0官方版
zblog采集软件v1.0官方版
下载
玩具模特图片平台v3.3.9官方版
玩具模特图片平台v3.3.9官方版
下载
icoffer上传下载工具v1.1.0官方版
icoffer上传下载工具v1.1.0官方版
下载
MovieCatcher(视频下载软件)v0.96绿色版
MovieCatcher(视频下载软件)v0.96绿色版
下载
度盘布不限速(百度网盘IDM下载器)v1.0绿色版
度盘布不限速(百度网盘IDM下载器)v1.0绿色版
下载
QwQDown(百度网盘不限速下载工具)v3.3.4免费版
QwQDown(百度网盘不限速下载工具)v3.3.4免费版
下载
速盘极速版(SpeedPanX)v1.9.81绿色版
速盘极速版(SpeedPanX)v1.9.81绿色版
下载
速盘(speedpan)v2.4.1绿色免费版
速盘(speedpan)v2.4.1绿色免费版
下载
bootcamp驱动v6.0官方版
bootcamp驱动v6.0官方版
下载
楼月QQ电脑监控软件8.3官方版
楼月QQ电脑监控软件8.3官方版
下载
有声单词之大学英语六级词汇1.2完美发音版
有声单词之大学英语六级词汇1.2完美发音版
下载
依朵动画识字(儿童早教识字)8.0免费体验版
依朵动画识字(儿童早教识字)8.0免费体验版
下载
VB数据库开发原代码绿色版
VB数据库开发原代码绿色版
下载
推荐软件
奇热小说
奇热小说
下载
QQ2019手机版
QQ2019手机版
下载
王者荣耀
王者荣耀
下载
百度浏览器迷你版
百度浏览器迷你版
下载
2345浏览器手机版
2345浏览器手机版
下载
网易邮箱
网易邮箱
下载
爱奇艺
爱奇艺
下载
网易云音乐
网易云音乐
下载
WPSOffice
WPSOffice
下载
优酷
优酷
下载
谷歌浏览器(Chrome)
谷歌浏览器(Chrome)
下载
迅雷看看播放器
迅雷看看播放器
下载
UC浏览器
UC浏览器
下载
QQ音乐
QQ音乐
下载
阿里旺旺买家版v9.12.10C官方版
阿里旺旺买家版v9.12.10C官方版
下载
360安全卫士v12.1官方版
360安全卫士v12.1官方版
下载
图文教程
猜你喜欢
小魔头世界ios版
小魔头世界ios版
下载
淘气购
淘气购
下载
涂书笔记电脑版
涂书笔记电脑版
下载
和风天气
和风天气
下载
试验小区施肥量计算工具v1.1
试验小区施肥量计算工具v1.1
下载
光彩云汇通
光彩云汇通
下载
辐射4Sky.AI预设MOD
辐射4Sky.AI预设MOD
下载
成语达人红包版
成语达人红包版
下载
热门标签