软件功能:可用多任务多线程方式采集任何网页上的任何指定文本内容,支持多级多网页内容混采,并进行你需要的相应过滤和处理,可以用搜索关键词方式采集需要的指定搜索结果,支持智能采集,光输网址就可以采集网页内容..
快截查看:软件下载 软件介绍 更新日志
本软件终身永久免费使用
若不会自己建立采集规则请联系官方带写
因为写规则是要花时间的,所以代写每个网站规则收费10~20元
购买智动博客助手 年卡送1个规则代写
软件介绍
-
1、采用底层HTTP方式采集数据,快速稳定,可建多个任务多线程采同时采集多个网站数据
-
2、用户可以随意导入导出任务
-
3、任务可以设置密码,保障您采集任务的细节安全不泄漏
-
4、并具有N页采集暂停/拨号换IP,采集遇特殊标记暂停/拨号换IP等多种破解防采集功能
-
5、可以直接输入网址采,或JavaScript脚本生成网址,或以关键词搜索方式采集
-
6、可以用登录采集方式采集需要登录帐号才能查看的网页内容
-
7、可以无限深入N个栏目采集内容、采链接,支持多级内容分页采集
-
8、支持多种内容提取模式,可以对采到的内容进行你需要的处理,如清除HTML,图片等等
-
9、可自编JAVASCRIPT脚本来提取网页内容,轻松实现任意部分内容的采集
-
10、可按设定的模版保存采到的文本内容
-
11、可将采到的多个文件按模版保存到同一个文件中
-
12、可对网页上的多个部分内容分别进行分页内容采集
-
13、可自设客户信息模拟百度等搜索引擎对目标网站采集
-
14、支持智能采集,光输网址就可以采到网页内容
-
15、本软件永久终身免费使用
2011/8/30 v1.8发布:
菜鸟福音,加入easy智能采集模式可以输网址就可采到内容
增强错误日志功能,可批量导出采失败网址
日志可以设最大容量,超过则自动删除
增加规则版本项目
修正获取登录COOKIE不全问题
修正自动关机,自动关软件冲突问题
修正采集内核BUG
HTTP底层内核优化,避免采集网页卡死问题
2011/8/2 v1.7发布:
增加重复内容清除工具
增加默认保存目录按钮
修正程序窗口标题显示及主窗口显示延时问题
修正保存文件时自动重命名路径非法字符BUG
优化待采内容清重复内核
优化待采网址数过多时占CPU高,耗时高等问题
2011/5/15 v1.6发布:
增加反防采集设置搜索几页拨号换IP
增加反防采集设置搜索遇到出错标拨号记换IP
修正测试时没有设置用户头BUG
修正等待任务启动过慢BUG
修正采集链接规则以JS脚本方式时不能返回多个网址BUG
2011/4/21 v1.5发布:
增加内容分页可以设置分隔符号
增加采集任务完成自动关机,自动关闭软件设置
增加加入过滤长度不够的内容,可以自己设,长度小于多少的不要,0为不限
增加增加清除标记“规则化文章”可自动清除文章中除了图片和段落符以外的HTML标记
修正等待任务不会自动启动BUG
2011/4/9 v1.4.2发布:
初始化文本框可填网址数长度增加
修正部分网页不能自动识别编码BUG
修正采集卡死BUG,该更新十分重要,采内容过多时经常出现,一定要更新哦
2011/3/24 v1.4.1发布:
修复暂停采集出错采集BUG
修复任务重复启动出错BUG
修复转为完全网址不正确BUG
2011/2/20 v1.4发布:
内容链接采集没有引用全局设置的客户端BUG修正
处理链接采集规则严重BUG修正(该BUG引起部分规则出错时,内容采不全)
2011/1/18 V1.3发布:
数据类型更新,不再兼容旧版数据,有旧版采集规则的请手动转换,或保留1.3以前版本采集使用
加入超强大的自定义JavaScript脚本提取内容功能
增加更简单强大的采集分页内容功能(去除了以前繁琐的实现方式)
增加错误信息管理器,更方便的查看和管理您的错误信息
降低最大测试采集链接数默认值
增加清除标记库:去除链接和链接文字
强化清除标记网址正则匹配
优化内核,减少对不必要页面的获取,加快了采集速度
2010/12/16:
可略过链接采集设置,直接以初始化链接为最终采集目标,是采集规则更灵活
多条内容采集分隔符以输入为准更人性化
2010/7/19:
发布智动网页内容采集器v1.1.6版本
修正相对地址转绝对地址BUG
测试时最大采几页控制
2010/6/30:
发布智动网页内容采集器v1.1.5版本
文件重复时可选自动重命名
修正最终结果加入链接BUG
修正多规则BUG
2010/6/28:
发布智动网页内容采集器v1.1.4版本
过滤标记列表竖向显示
增加默认保存文件目录
智动资讯可选显示
修正部分BUG
2010/6/1:
发布智动网页内容采集器v1.1.3版本
修正线程并发写文件保存BUG
2010/5/31:
发布智动网页内容采集器v1.1.1~1.12版本
修正了模版为空不保存网页源码的BUG
v1.12:
修正内部BUG
修正线程并发BUG
修正快捷键冲突BUG
2010/05/28:
发布智动网页内容采集器v1.1.0版本
更新内容:
1、修改了链接采集方式,适应所有复杂规则采集
2、保存内容采用固定文件名时可以进行修改
3、复制时可以修改任务名称
4、增加相同文件标题处理方式
5、增加清除网址规则、清除QQ、电话号码等规则
6、修正补全为完全地址时图片链接补全BUG
7、修正内置IE打开源码为乱码BUG
8、修正内置IE中文URL为乱码BUG
2010/05/23:
发布智动网页内容采集器v1.0.0版本