杂乱教程 | 2019年11月02日13时58分36秒 | 评论:0
完成网址:https://aizhancloud.cn/mipcms/ (已关站)
比如目标地址:http://www.域名.com/shanggan/ 伤感说说
一:网址采集
那么采集任务里网址写正则倒序 伤感说说规则:
http://www.域名.com/shanggan/index_[地址参数].HTML
提示:(从1到76是伤感说说里第一页到最后一页,伤感说说是分类主页不是1,所以要从2开始,http://www.域名.com/shanggan/index_2.html 这是第二页的地址这个地址参数就是正则顺序排列,图中设置的1开始每次递增1就是1+1+1+1..+n到最后76页停止,倒序就是从76页/75页/74页…/2页停止采集)
二:内容采集
内容采集分为标题和内容,我mipcms采集规则添加了标题/内容/标签这三种
标题:
开头<title>
结尾</title>
添加采集内容替换 -说说控 替换为 (不填写)
(这样源代码标题后面的后缀-说说控就是删除了,mipcms里标题后面自带网站标题所以后面替换为不填写)
内容:
说说控这个网站的内容前面标签为:<div>
结尾标签:</div>
<div>
(这内页都是采集源代码的,查看文章的源代码 看看内页前面的标签和后面的标签即可,数据取决于标签中间的数据)
文章内图片替换
采集图片:<img src="/d/file/
替换为<img src="http://www.域名.com/d/file/
这个就是看看目标站的图片路径,给路径加一个对方站的网址,这样就可以实现盗用对方站的图片url,但是有的站开启了防盗链就是保存下载图片到本地了
标签:
开头:<meta name="keywords" content="
结尾" />
这个一般通用,源代码里的便签前面和后面一般都这样写!
下面是这三个截图
三:内容发布规则这是个发布模块,mipcms的,我们点击Web发布配置 先导入规则,然后添加网站地址和编码,修改模块内设密码
发布接口模块下载:https://aizhancloud.lanzous.com/i74khib
详情如下
双击发布模块在内容发布参数修改模块密码,mipcms的密码后台火车头插件里可以自己设置!
记得写好了 获取分类 下面有保存自己保存一下,方便后期发布内容
四:开始发布内容
勾选显示所有配置 勾选自己获取的分类保存的配置 选择分类
最后 底部保存并退出
最后执行 采集就完事了!
相关文章
网友点评
本文暂无评论 - 欢迎您
⎛⎝爱站云⎠⎞
AiZhanCloud.Com