Jack博客

网站首页 >> 杂乱教程 >> 正文

采集址:http://www.域名.com/ 

完成网址:https://aizhancloud.cn/mipcms/ (已关站)

比如目标地址:http://www.域名.com/shanggan/ 伤感说说

一:网址采集

那么采集任务里网址写正则倒序 伤感说说规则:

http://www.域名.com/shanggan/index_[地址参数].HTML

针对mipcms站群程序的火车头采集教学附带规则

提示:(从1到76是伤感说说里第一页到最后一页,伤感说说是分类主页是1,所以要从2开始,http://www.域名.com/shanggan/index_2.html 这是第二页地址这个地址参数就是正则顺序排列,图中设置的1开始每次递增1就是1+1+1+1..+n到最后76页停止,倒序就是从76页/75页/74页…/2页停止采集)

二:内容采集

内容采集分为标题内容,我mipcms采集规则添加了标题/内容/标签这三种

采集内页方式均是网页源代码匹配正则采集:

标题:

开头<title>

结尾</title>

添加采集内容替换 -说说控 替换为 (不填写)

(这样源代码标题后面的后缀-说说控就是删除了,mipcms里标题后面自带网站标题所以后面替换为不填写)

内容:

说说控这个网站的内容前面标签为:<div>

结尾标签:</div>

<div>

(这内页都是采集源代码的,查看文章的源代码 看看内页前面的标签和后面的标签即可,数据取决于标签中间的数据)

文章内图片替换

采集图片:<img src="/d/file/

替换为<img src="http://www.域名.com/d/file/

这个就是看看目标站的图片路径,给路径加一个对方站的网址,这样就可以实现盗用对方站的图片url,但是的站开启了防盗链就是保存下载图片到本地了

标签:

开头:<meta name="keywords" content="

结尾" />

这个一般通用,源代码里的便签前面和后面一般都这样写!

下面是这三个截图

针对mipcms站群程序的火车头采集教学附带规则

针对mipcms站群程序的火车头采集教学附带规则

针对mipcms站群程序的火车头采集教学附带规则

三:内容发布规则这是个发布模块,mipcms的,我们点击Web发布配置 先导入规则,然后添加网站地址和编码,修改模块内设密码

发布接口模块下载:https://aizhancloud.lanzous.com/i74khib 

详情如下

针对mipcms站群程序的火车头采集教学附带规则

针对mipcms站群程序的火车头采集教学附带规则

针对mipcms站群程序的火车头采集教学附带规则

双击发布模块在内容发布参数修改模块密码,mipcms的密码后台火车头插件里可以自己设置!

记得写好了 获取分类 下面有保存自己保存一下,方便后期发布内容

四:开始发布内容

针对mipcms站群程序的火车头采集教学附带规则

勾选显示所有配置 勾选自己获取的分类保存的配置 选择分类

最后 底部保存并退出

最后执行 采集就完事了!

本文标签: mipcms   火车头   采集站   说说控  

温馨提示:本文是作者 爱站云 的原创文章,转载请注明出处和附带本文链接!

网友点评

本文暂无评论 - 欢迎您

您好,请先 QQ登录 后进行评论,如您已登录账户,请点击 刷新页面 再进行评论!

⎛⎝爱站云⎠⎞

⎛⎝爱站云⎠⎞

AiZhanCloud.Com

爱站云专注ZBLOG建站领域,分享个人所得技术,用心做好个人博客,喜欢的小伙伴就关注我吧!
«    2023年9月    »
123
45678910
11121314151617
18192021222324
252627282930
最新留言
文章归档
标签列表

Powered By Z-BlogPHP Theme By Jack主题

Sitemap | TXT地图 | HTML地图后花园

免责声明:本博客所展示内容均为互联网技术教程分享,如有侵权等违规信息请联系QQ客服进行删除处理,谢谢配合!

切换白天模式 切换夜间模式 白天返回顶部 夜间返回顶部