新手学习seo的一些感想——关于蜘蛛爬取新站
最近在看昝辉Zac 的《SEO实战密码》,觉得这本书不错,把看完书的一些想法记录下来,希望各位大佬指教。搜索引擎爬取网页的是广度优先与深度优先混合使用的,广度优先策略解决爬取网站数量的问题,深度优先策略解决爬取网站内页数量的问题。
所以广度优先对于蜘蛛服务器压力远远小于深度优先,蜘蛛对于新站前期都只爬取首页,就不深入爬取内页了,毕竟爬取也需要成本,这就是为什么谷歌收录大于百度,百度大于国内其他二线搜索引擎,因为投入的成本都不是一个级别的,当蜘蛛多次爬取首页发现网站值得爬取内页后,才会爬取内页。
我分析了我的网站https://www.ttyxq.com的爬取记录。连续一个月,只爬取首页,内容页完全没爬取,api提交,sitemap都做了的,就是只爬首页。
那么蜘蛛怎么知道这个新站值得爬取呢?首先肯定是稳定,然后就是这个网站的价值,蜘蛛又怎么评价新站的价值啊?答案就是外链,有人说是内容的原创性,个人觉得原创性应该是下一个阶段。因为蜘蛛都还没爬取你的内页,怎么自动你的网页是原创的啊。接下来就是一些次要因素了,是否备案,是否ssl。个人觉得这些都有一定的权重,能提高网站的爬取价值。
关于“nofollow”,现在基本上所有的站为了避免分散权重,对于外部链接都加了“nofollow”,那么大家都加和都不加,有什么区别呢?所有个人觉得,就算加了“nofollow”的链接,搜索引擎应该还是会在数据库里,给你的引用+1,引用多了,价值就大了。
说的很好,我也看过《seo实战密码》这本书,但是有一点不是特别同意
第一,外链在前几年来说简直就是优化利器,“内容为王,外链为皇”足以看出外链的重要性,在前几年算法还没这样成熟的时候,一个网页完全可以通过增加外链上首页。但是现在不行了,因为算法日益完善和成熟,外链的作用似乎也没有以前那么大了(当然不是说外链不重要,还是很重要的,只是作用不如以前好了)
第二,现在几乎所有的平台都加了Nofollow属性,这个标签的意义是告诉搜索引擎"不要追踪此网页上的链接或不要追踪此特定链接"。换而言之,就是说蜘蛛看到加了nofollow的链接,不会抓取更不会传递权重。所以也就不存在你说的“引用+1”。
当然,加了nofollow的链接可能对优化外链这一块来讲作用不大,但是如果作为品牌的推广和宣传,效果还是可以的。虽然不能吸引蜘蛛,但是用户可以直接点击链接进入我们的网站,在一定程度上,也增加了我们网站的访问量。
蜘蛛抓取的几率才会更大
我网站已经将近一个月 但是只收录内页 不收录首页
围观围观,还没看完过这本书
想法不错,。。
迷茫的一笔,不知道咋做了
我也很迷茫。
我也很迷茫。