搜索引擎爬虫爬的是虚拟主机或服务器里的文件,还是像人一样按浏览器的网址链接爬的?
具体来说是链接到页面代码,抓取
你说的两种都不是!
从域名爬链接,然后爬每个页面的代码! 所以说内链很重要。它是在模仿人,但不是人。例如 图片它看不懂
链接
让更多人参与回答