搜外网>搜外问答>问答页面

搜索引擎爬虫爬的是虚拟主机或服务器里的文件,还是像人一样按浏览器的网址链接爬的?

搜索引擎爬虫爬的是虚拟主机或服务器里的文件,还是像人一样按浏览器的网址链接爬的? 

追加问题
    3 人参与回答

具体来说是链接到页面代码,抓取

你说的两种都不是!

从域名爬链接,然后爬每个页面的代码! 所以说内链很重要。它是在模仿人,但不是人。例如  图片它看不懂

链接