http://www.doc88.com/p-6877308450652.html[?] 看这个链接的快照 蜘蛛可以抓取到他的内容,但是这个url的源代码里面是没有内容的,问一下是怎么弄的。什么原理
<p>跟豆丁网一样,都是用的flash。</p><p></p><p>大家都知道内容都是在flash里,查看源码的时候是无法看到文字的,那么搜索引擎百度和谷歌是怎么抓取的呢。很多人以为是和swfobject有关系,实际上文库对Google或百度机器人做了优化。机器人抓到的内容比用户直接浏览多了一个容器<div id="textContainer" class="mt"></p><p>,里面包含了pdf文档的文字内容。</p>
匿名用户
用的框架做的有可能
跟大佬学习学习
我是来学习的,刚刚找了一下从object之后就找不到了。
大神说的对
1.推推蛙说的没错。他这种技术其实用处不大。楼主干嘛参考这种网站呢?2.他就是把内容做成了JS调用的。这种不利于蜘蛛抓取。
用框架结构做的
了解一下
代码JS或控件
1、这个你可以了解一下JS;
2、这个道客巴巴的文档,是属于flash系统,只是提供展现,蜘蛛无法爬行和抓取;
3、这在文档及付费资源的站点,这都很常见,flash、插件、js等很多蜘蛛无法抓取,但是能展现,用户是能看的,如果源码都能看到的,用户一般都能直接复制了,何谈增值付费。
这个很好理解,就是如果说一个页面没有内容,那么排名不会很好,那么必须要让搜索引擎抓取到就通过代码隐藏只展示搜索引擎看,而用户则必须付费
让更多人参与回答