有谁知道这种网站的内容是怎么采集的呢? 悬赏3元 已结束
类似这样的 http://sp.17house.com/sb/wenda/cc14c89a31a72110.html[?]
反正有提问 有回答,肯定不是真人回答的 都是采集的,但是不知道是怎么采集的,但是百度这些平台都有采集限制,那么像这种网站页面数量这么大,都是怎么采集出来的呢?
24 人参与回答
用户156223 等 1 人赞同该回答
你可以看下这个站 它有采集功能
这种一般是人工整理~
手打呀
这个看着不像采集的呀
自己编辑的吧
买个采集工具,免费的效果都不好
这种一般是有员工自己编辑的,或者是随机采集一些的
火车头采集工具
还好啦
明显自己弄得
应该是自己写的并发布的
这个难度较大
这估计自己编辑的吧 招人专门负责这块
用payton爬虫
也是使用爬虫采集的,分布式爬虫,多进程多线程爬虫,如果出现限制就使用D理ip,绕过即可

