搜外网>搜外问答>问答页面

火车头采集文章怎么过滤掉文章内某一段div的内容

火车头采集文章怎么过滤掉文章内某一段div的内容

追加问题
    7 人参与回答
大步向前走
大步向前走 · 5118VIP会员优惠码「EA67D8」

如果想过滤某一段div的内容,首页前提是这个div有相同的内容部分,或者div有属性值且是唯一的,比如<div class="wenzhang">*</div>,当然也是可以通过正则表达式来弄,具体还是需要看你要过滤的文章是否有相同之处或者是唯一性的。

获取div唯一标签

某一段div的内容。这个可能有点难了,更改采集的首标签和尾标签把那个过滤掉吧,如果你那个div内容一样的话,直接文字替换就好了。

还有就是如果直接采集到网站里面的话,div标签可能会导致排版错误哦,最好将div换成p标签。。O(∩_∩)O哈哈~,个人见解,有误轻喷

SEO培训招生中
189