5 人参与回答
不吹牛皮,我连你说的是啥玩意都不晓得。
花1400RMB充了火车头的永久会员,说说感受吧,没收广告费...
(1)可以设置采集规则,原理和phython差不多,通过匹配源代码中的列表起始和结尾,匹配区域中的a标签url并采集过来,支持多页采集,例如别人文章列表是1页10篇文章,共有90页,也可以一次过采集过来。
(2)采集内容页,在上面第一步找到对应的所有文章内页链接基础下,爬取每篇文章的标题和内容,也可以下载来源文章内容中的图片,并在引用路径上对应起来。
(3)内容发布,支持市面上大众的CMS程序一键发布,例如织梦,帝国,WordPress等等。我自己用的是dede织梦,通常情况下是采集好一批文章过来后,大概几百上千篇,每天手动在采集器中打勾5篇左右发布,比较有效率。
不吹牛皮,我连你说的是啥玩意都不晓得。
爱约拍 突兀街