火车采集器能采集什么内容?

采集的就直接用吗?站群是不是合适采集,具体怎么操作,大侠指导了。

追加问题
    5 人参与回答

不吹牛皮,我连你说的是啥玩意都不晓得。

爱约拍  突兀街

蘋果與蛇
蘋果與蛇 · Google SEO,外贸企业的必备增长引擎,微信:15877068041

不知道你描述的什么

可以直接导入数据库,但没必要,现在采集站很难了

维Vitta
维Vitt · 3年前端&程序工程师/两性交友/ViTa泡妞教程

花1400RMB充了火车头的永久会员,说说感受吧,没收广告费...

(1)可以设置采集规则,原理和phython差不多,通过匹配源代码中的列表起始和结尾,匹配区域中的a标签url并采集过来,支持多页采集,例如别人文章列表是1页10篇文章,共有90页,也可以一次过采集过来。

(2)采集内容页,在上面第一步找到对应的所有文章内页链接基础下,爬取每篇文章的标题和内容,也可以下载来源文章内容中的图片,并在引用路径上对应起来。

(3)内容发布,支持市面上大众的CMS程序一键发布,例如织梦,帝国,WordPress等等。我自己用的是dede织梦,通常情况下是采集好一批文章过来后,大概几百上千篇,每天手动在采集器中打勾5篇左右发布,比较有效率。

不吹牛皮,我连你说的是啥玩意都不晓得。